58
www.ugb.sn Analyse Factorielle des Correspondances (AFC) L3f MA; Info_SI; Info_Reseaux g - UFR S.A.T Pr. Ousmane THIARE [email protected] [www.ousmanethiare.com] 16 avril 2020

Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

wwwugbsn

Analyse Factorielle desCorrespondances (AFC)

L3MA Info_SI Info_Reseaux - UFR SAT

Pr Ousmane THIARE

othiareugbedusn[wwwousmanethiarecom]

16 avril 2020

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse Factorielle des Correspondances(AFC)

1 Introduction2 Variables qualitatives3 Tableau de contingence4 Marges et profils5 Proprieacuteteacutes des profils6 Le X 2 drsquoeacutecart agrave lrsquoindeacutependance7 Caractegravere significatif du X 2

8 Analyse des correspondances de deux variables lesdonneacutees

9 Repreacutesentation geacuteomeacutetrique des profils10 Comment eacutetudier ces donneacutees11 La meacutetrique du X12 Pourquoi la meacutetrique du X 2 13 Autres proprieacuteteacutes de la meacutetrique du du X 2

14 ACP des deux nuages de profils15 g est un facteur principal16 Calcul de lrsquoACP17 Comparaison lignes-colonnes18 Interpreacutetation des reacutesultats19 Contributions agrave lrsquoinertie20 Formules de transition21 Deacutecomposition de lrsquoinertie22 Analyse des correspondances multiples23 Les donneacutees24 Tableau disjonctif et tableau de contingence25 Tableau disjonctif joint26 Cas p=227 Reacutesolution des eacutequations28 Le nombre de valeurs propres29 Le cas geacuteneacuteral p gt 230 Exemple de tableau de Burt31 Les coordonneacutees factorielles des cateacutegories32 Formules barycentriques33 Formules barycentriques34 Proprieacuteteacutes des valeurs propres35 Barycentres et repreacutesentation36 Variables et axes factoriels37 Individus et axes factoriels38 Contribution agrave lrsquoinertie totale39 Les variables suppleacutementaires40 Valeurs-test pour les variables suppleacutementaires41 Pratique de lrsquoanalyse des correspondances multiples42 Points communs entre AFC et ACM43 Diffeacuterences entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse Factorielle desCorrespondances (AFC)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990

LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnes

Etudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de Y

Le cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 2: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse Factorielle des Correspondances(AFC)

1 Introduction2 Variables qualitatives3 Tableau de contingence4 Marges et profils5 Proprieacuteteacutes des profils6 Le X 2 drsquoeacutecart agrave lrsquoindeacutependance7 Caractegravere significatif du X 2

8 Analyse des correspondances de deux variables lesdonneacutees

9 Repreacutesentation geacuteomeacutetrique des profils10 Comment eacutetudier ces donneacutees11 La meacutetrique du X12 Pourquoi la meacutetrique du X 2 13 Autres proprieacuteteacutes de la meacutetrique du du X 2

14 ACP des deux nuages de profils15 g est un facteur principal16 Calcul de lrsquoACP17 Comparaison lignes-colonnes18 Interpreacutetation des reacutesultats19 Contributions agrave lrsquoinertie20 Formules de transition21 Deacutecomposition de lrsquoinertie22 Analyse des correspondances multiples23 Les donneacutees24 Tableau disjonctif et tableau de contingence25 Tableau disjonctif joint26 Cas p=227 Reacutesolution des eacutequations28 Le nombre de valeurs propres29 Le cas geacuteneacuteral p gt 230 Exemple de tableau de Burt31 Les coordonneacutees factorielles des cateacutegories32 Formules barycentriques33 Formules barycentriques34 Proprieacuteteacutes des valeurs propres35 Barycentres et repreacutesentation36 Variables et axes factoriels37 Individus et axes factoriels38 Contribution agrave lrsquoinertie totale39 Les variables suppleacutementaires40 Valeurs-test pour les variables suppleacutementaires41 Pratique de lrsquoanalyse des correspondances multiples42 Points communs entre AFC et ACM43 Diffeacuterences entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse Factorielle desCorrespondances (AFC)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990

LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnes

Etudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de Y

Le cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 3: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse Factorielle desCorrespondances (AFC)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990

LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnes

Etudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de Y

Le cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 4: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990

LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnes

Etudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de Y

Le cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 5: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnes

Etudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de Y

Le cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 6: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction

Lrsquoanalyse factorielle des correspondances (AFC) ouanalyse des correspondances simples est une meacutethodeexploratoire drsquoanalyse des tableaux de contingence Ellea eacuteteacute deacuteveloppeacutee par J-P Benzecri durant la peacuteriode1970-1990LrsquoAFC consideacutereacutee comme une ACP particuliegravere doteacutee dela meacutetrique du X 2 (Khi-2) qui ne deacutepend que du profildes colonnes du tableau Lrsquoanalyse permet dans le plandes deux premiers axes factoriels une repreacutesentationsimultaneacutee des ressemblances entre les colonnes ou leslignes du tableau et de la proximiteacute entre lignes etcolonnesEtudier sur N individus les liaisons entre deux variablesX et Y Chaque variable deacutetermine deux partitions delrsquoensemble des individus selon les modaliteacutes

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de Y

Le cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 7: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de Y

Le cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 8: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)

Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 9: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

On note souvent I lrsquoensemble des modaliteacutes de lavariable X et J celui des modaliteacutes de YLe cardinal de I est noteacute n et celui de J est noteacute m Pourchercher les liaisons entre X et Y nous allons croiser lesdeux partitions pour obtenir un tableau de contingenceindexeacute par I times J ( on deacutefinit un ordre sur I et J qui peutecirctre eacuteventuellement arbitraire afin de pouvoir construirece tableau)Dans la case associeacutee agrave la i-egraveme ligne et agrave la j-egravemecolonne on eacutecrit lrsquoeffectif des individus ayant la i-egravememodaliteacute pour la variable X et la j-egraveme modaliteacute pour lavariable Y celui-ci est noteacute kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 10: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

Tableau de contingence compleacuteteacute par ses marges

HHHHHHX

Y middot middot middot j-egraveme colonne middot middot middot marge

middot middot middot middot middot middot middot middot middot middot middot middot middot middot middoti-egraveme ligne middot middot middot kij middot middot middot kimiddot middot middot middot middot middot middot middot middot middot middot middot middot middot middot

marge middot middot middot kj middot middot middot N

On pose

kj =nsum

i=1

kij et ki =msum

j=1

kij

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 11: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite)

kj est appeleacute lrsquoeffectif marginal de la j-egraveme modaliteacute deYki est appeleacute lrsquoeffectif marginal de la i-egraveme modaliteacute deXLes eacuteleacutements du tableau de contingence diviseacutes parlrsquoeffectif total N constituent le tableau des freacutequences ougravelrsquoon note fij lrsquoeacuteleacutement geacuteneacuterique Ce tableau permet dedeacutefinir deux marges une colonne indexeacutee par i

drsquoeacuteleacutement geacuteneacuterique fi =sumjisinJ

fij et une ligne indexeacutee par j

drsquoeacuteleacutement geacuteneacuterique fj =sumiisinI

fij ce sont les freacutequences

marginales

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 12: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Introduction (suite et fin)

La freacutequence fi (respectivement fj ) peut ecirctre interpreacuteteacuteecomme le poids de la i-egraveme modaliteacute de X on peutnoter celui-ci pi (respectivement le poids pj de la j-egravememodaliteacute de Y)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 13: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives

Soit X une variable qualitative On dispose drsquouneacutechantillon de n individus sur lesquels la variable estmesureacuteeModaliteacutes (ou cateacutegories) les valeurs que peut prendreune variable qualitative si la variable a r modaliteacutes(valeurs possibles) on note xi 1 le i le r ces modaliteacutesEffectif le nombre d rsquooccurrence de la modaliteacute xi dans

lrsquoeacutechantillon on le note ni et on arsum

i=1

ni = n

Freacutequence crsquoest la grandeur fi = nin la somme desfreacutequences sur les modaliteacutes est 1 On utilise souvent lepourcentage 100fi

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 14: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables qualitatives (suite et fin)

Repreacutesentation on peut utiliser un tableau avec r lignesde la forme

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 15: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau de contingence

Soient X et Y deux variables qualitatives agrave r et smodaliteacutes respectivement deacutecrivant un ensemble de nindividusDeacutefinition le tableau de contingence est une matrice agrave rlignes et s colonnes renfermant les effectifs nij drsquoindividustels que X = xi et Y = yi

La constitution de ce tableau est ce que les praticiens desenquecirctes appellent un laquo tri croiseacute raquoPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 16: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Marges et profils

Marge en ligne Crsquoest la somme ni =ssum

j=1

nij crsquoest-agrave-dire

lrsquoeffectif total de la modaliteacute xi de X

Marge en colonne Crsquoest la somme nj =rsum

i=1

nij

crsquoest-agrave-dire lrsquoeffectif total de la modaliteacute yi de YDeux lectures possibles selon la variable que lrsquoonprivileacutegie on peut deacutefinir

le tableau des profils-lignes nijni qui repreacutesente lafreacutequence de la modaliteacute yj conditionnellement agraveX = xi la somme de chaque ligne est rameneacutee agrave 100le tableau des profils-colonnes nijnj qui repreacutesente lafreacutequence de la modaliteacute xi conditionnellement agrave Y = yi la somme de chaque colonne est rameneacutee agrave 100

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 17: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils

Moyenne la moyenne des profils-lignes (avec poidscorrespondant aux effectifs marginaux des lignes) est leprofil marginal des colonnes

rsumi=1

ni

ntimes

nij

ni=

njn

et de mecircme pour les colonnesssum

j=1

njntimes

nij

nj=

ni

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 18: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des profils (suite et fin)

Indeacutependance empirique lorsque tous les profils lignessont identiques il y a indeacutependance entre X et Y puisquela connaissance de X ne change pas la reacutepartition de YOn a pour tout j

n1j

n1=

n2j

n2= middot middot middot =

nrj

nr =

n1j + middot middot middot+ nrj

n1 + middot middot middot+ nr =

njn

et donc nij =ninj

n

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 19: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance

Deacutefinition crsquoest la grandeur suivante aussi noteacutee X 2 ouX 2

d2 =rsum

i=1

ssumj=1

(nij minusninj

n )2

ninjn

= n

rsumi=1

ssumj=1

n2ij

ninjminus 1

Si les variables sont indeacutependantes d2 = 0Borne supeacuterieure Comme nij le ni on a

rsumi=1

ssumj=1

n2ij

ninjle

rsumi=1

ssumj=1

nij

nj=

ssumj=1

sumri=1 nij

nj=

ssumj=1

njnj

= s

et donc d2 le n(s minus 1)On fait de mecircme pour r et

ϕ2 =d2

nle min(s minus 1 r minus 1)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 20: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le X 2 drsquoeacutecart agrave lrsquoindeacutependance (suite et fin)

Deacutependance fonctionnelle si ϕ2 = s minus 1 alors pourchaque i soit nij = ni soit nij = 0 il existe une uniquecase non nulle par ligne Y est fonctionnellement lieacutee agrave X Deacutependance inverse cette relation ne signifie pas que Xest fonctionnellement lieacutee agrave Y sauf si r=s On peut alorsrepreacutesenter le tableau comme une matrice diagonaleContribution au X 2 crsquoest le terme

(nij minusninj

n )2

ninjn

qui permet de mettre en eacutevidence les associationssignificatives entre cateacutegories de deux variables

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 21: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Caractegravere significatif du X 2

Problegraveme agrave partir de quelle valeur de d2 doit-onconsideacuterer que les variables X et Y sont indeacutependantes Meacutethode on suppose que X et Y sont issus de tirages dedeux variables aleacuteatoires indeacutependantes On peut alorsmontrer que d2 est une reacutealisation drsquoune variable aleacuteatoireD2 qui suit une loi X 2

(rminus1)(sminus1)Deacutefinition Loi du khi-deux agrave p degreacutes de liberteacutes X 2

p estla loi de la variable

sumpi=1 = U2

i ougrave les Ui sont desvariables gaussiennes reacuteduites indeacutependantesLe test du X 2 on se fixe un risque drsquoerreur α (001 ou005 en geacuteneacuteral) et on calcule la valeur d2

c telle queP(X 2

(rminus1)(sminus1) gt d2c ) = α Si d2 gt d2

c on considegravere quelrsquoeacuteveacutenement est tregraves improbable et que donc quelrsquohypothegravese originale drsquoindeacutependance doit ecirctre rejeteacutee Ontrouvera en geacuteneacuteral ces valeurs dans une tablepreacutecalculeacuteePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 22: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances de deuxvariables les donneacutees

Effectifs on a un tableau de contingence N agrave m1 lignes etm2 colonnes reacutesultant du croisement de deux variablesqualitatives X1 et X2 agrave m1 et m2 modaliteacutesrespectivement On note D1 et D2 les matrices diagonalesdes effectifs marginaux

Profils le tableau des profils des lignes nijni est donneacutepar Dminus1

1 N et celui des profils des colonnes nijnj parNDminus1

2 Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 23: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Repreacutesentation geacuteomeacutetrique des profils

Nuage de points les profils-lignes forment un nuage dem1 points de Rm2 Chaque point est affecteacute drsquoun poidseacutegal agrave sa freacutequence marginale nin et la matrice despoids est donc 1

n D1Centre de graviteacute crsquoest le profil marginal car

gl =1n(Dminus1

1 N)tD11m1 = (n1n middot middot middot nm2

n)t

Profils-colonne les lignes du tableau Dminus11 N t forment un

nuage de m2 points de Rm1 avec matrice des poids 1n D2

et centre de graviteacute

gc = (n1

n middot middot middot nm1

n)t

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 1954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 24: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comment eacutetudier ces donneacutees

Cas indeacutependant en cas drsquoindeacutependance empirique onaura

nij

ni=

njn

etnij

nj=

ni

n

et les deux nuages sont alors reacuteduits agrave leurs centres degraviteacute respectifsDimension des nuages comme les profils somment agrave 1les m1 profils-lignes sont situeacutes dans le sous-espace W1de dimension m2 minus 1 deacutefini par

summ2j=1 xj = 1 et xj ge 0

ACP lrsquoeacutetude de la forme des nuages au moyen delrsquoAnalyse en Composantes Principales permettra derendre compte de la structure des eacutecarts agravelrsquoindeacutependance

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 25: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

La meacutetrique du X 2

Profils-lignes la distance entre deux profils-lignes i et i prime

est

d2X 2(i i prime) =

m2sumj=1

nnj

(nij

niminus

ni prime j

ni prime )2

ce qui revient agrave utiliser la meacutetrique diagonale nDminus12

Inertie lrsquoinertie totale du nuage des profils-lignes parrapport agrave gl est

Igl =

m1sumi=1

ni

nd2X 2(i gl) =

m1sumi=1

m2sumj=1

ni

nj(nij

niminus

njn)2

=

m1sumi=1

m2sumj=1

1ninj

(nij minusninj

n)2 = ϕ2

Cette inertie mesure donc lrsquoeacutecart agrave lrsquoindeacutependancePr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 26: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pourquoi la meacutetrique du X 2

Pondeacuteration la pondeacuteration nnj permet de donner desimportances comparables aux diffeacuterentes variablesEquivalence distributionnelle si deux colonnes j et j

primede

N ont le mecircme profil il est logique de les regrouper enune seule drsquoeffectif nij + nij prime on a alors nijnj = nij primenj prime

nnj

(nij

nminus

ni prime j

ni prime)2 +

nnj prime

(nij prime

niminus

ni prime j prime

ni prime)2

=n

nj + nj prime(nij + nij prime

niminus

ni prime j + ni prime j prime

ni prime )2

La distance entre les profils-ligne est donc inchangeacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 27: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Autres proprieacuteteacutes de la meacutetrique du du X 2

Proprieacuteteacutes de gl le vecteur Ogl est orthogonal agrave W1 ausens de la meacutetrique du X 2 car

〈glx Ogl〉 = (x minus gl)tnDminus1

2 gl = (x minus gl)t1m2 = 0

et la norme de gl est gl2X 2 = gtl nDminus1

2 gl = gtl 1m2 = 1

Tous les vecteurs centreacutes du nuage sont doncorthogonaux agrave gl Profils-colonnes on deacutefinit la distance entre deuxprofils-colonnes j et j prime comme

d2X 2(j j

prime) =

m1sumi=1

nni

(nij

njminus

nij prime

nj prime)2

ce qui correspond agrave une meacutetrique de matrice nDminus11 Ses

proprieacuteteacutes sont similaires agrave celles sur les profils-lignesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 28: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

ACP des deux nuages de profils

Il y a deux possibiliteacutes qui sont en dualiteacute exacteProfils-lignes

tableau de donneacutees X = Dminus11 N

meacutetrique M = nDminus12

poids D = Dn

Profils-colonnestableau de donneacutees X = Dminus1

2 N t meacutetrique M = nDminus1

1 poids D = D

n Autres donneacutees

Centre de graviteacute g = X tD1Matrice de variance-covariance

V = X tDX minus ggt = (X minus 1gt)tD(X minus 1gt)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 29: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

g est un facteur principal

Pourquoi g est vecteur propre de VM associeacute agrave lavaleur propre 0 car comme g est X 2-orthogonal agrave W

VMg = (X minus 1gt)tD(X minus 1gt)Mg

et on a donc X tDXMg = VMg + ggt = 0 + ggX 2 = gAutres axes les autres valeurs et vecteurs propres de VMet X tDXM sont identiques car pour tout vecteur u perp g

X tDXMu = VMu + ggtMu = VMu + g〈gu〉X 2 = VMu

Centrage il est inutile de centrer les tableaux de profil oneffectue une ACP non centreacutee et on eacutelimine la valeurpropre 1 associeacutee agrave lrsquoaxe principal g et au facteur principalMg=1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 30: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Calcul de lrsquoACP

On fait drsquoabord le calcul pour les profils-lignesFacteurs principaux ils sont vecteurs propres de

MX tDX = (nDminus12 )(Dminus1

1 N)t D1

n(Dminus1

1 N) = Dminus12 N tDminus1

1 N

On a donc pour chaque axe principal k

Dminus12 N tDminus1

1 Nuk = λkuk

Composantes principales la composition principaleassocieacutee au facteur uk est ak = Xuk = Dminus1

1 Nuk elle estvecteur propre de la matrice Dminus1

1 NDminus12 N t car

Dminus11 NDminus1

2 N tak = Dminus11 NDminus1

2 N tDminus11 Nuk = λkDminus1

1 Nuk = λkak

Profils-colonnes on eacutechange les indices 1 et 2 et ontranspose NPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 31: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Comparaison lignes-colonnes

Comparaison les deux analyses conduisent aux mecircmesvaleurs propres et les facteurs principaux de lrsquoune sont lescomposantes principales de lrsquoautre (agrave un facteur pregraves)

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 32: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Interpreacutetation des reacutesultats

Coordonneacutees des points les coordonneacutees desprofils-lignes et profils-colonnes srsquoobtiennent encherchant les vecteurs propres des produits des tableauxde profils Ce sont les grandeurs principales agrave obtenirProjection des nuages il est possible de projeter lesdeux nuages de points sur la mecircme repreacutesentation Onjustifiera plus tard le sens de cette repreacutesentation et soninterpreacutetationCercle des correacutelations il nrsquoa aucun inteacuterecirct ici puisqueles veacuteritables variables sont qualitatives(non) effet de taille comme les composantes variablessont centreacutees (

summ1i=1 niaki =

summ2j=1 njbkj) on sait que les

cordonneacutees des ak et bk ne peuvent ecirctre toutes de mecircmesigne il nrsquoy a donc jamais drsquoeffet de taille

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 33: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contributions agrave lrsquoinertie

Contribution des profils-lignes On sait queλk =

summ1i=1

nin (aki)

2 ougrave aki est la coordonneacutee duprofil-ligne i sur la kiegraveme composante principale de lrsquoACPsur les profils-lignes On deacutefinit donc la contribution de i agravelrsquoaxe principal k comme

ni

n(aki)

2

λk

On consideacuterera les cateacutegories ayant les influences lesplus importantes (typiquement gtnin) commeconstitutives des axes on regardera aussi le signe de lacoordonneacuteeContribution des profils-colonnes pour les mecircmesraisons la contribution du profil-colonne k est

njn(bkj)

2

λkPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 2954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 34: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules de transition

But on cherche une relation entre les vecteurs ak et bkpour eacuteviter de faire deux diagonalisations de matrices Parexemple si m1 lt m2 on diagonalisera la matriceDminus1

1 NDminus12 N t

Formules un calcul simple donne les formules suivantes

bk =1radicλk

Dminus12 N tak soit bjk =

1radicλk

m1sumi=1

nij

njaki

ak =1radicλk

Dminus11 Nbk soit aki =

1radicλk

m2sumj=1

nij

nibkj

Meacutethode comme ak est (agrave une normalisation pregraves) lefacteur principal associeacute agrave bk on sait que bk = αDminus1

2 N tak Pour deacuteterminer α il suffit drsquoeacutecrire que bt

kD2n bk = λk

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 35: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Deacutecomposition de lrsquoinertie

ϕ2 et valeurs propres on sait que lrsquoinertie totale (et doncla somme des valeurs propres) est eacutegale agrave ϕ2 Comme ily a au plus min(m1 minus 1m2 minus 1) valeurs propres onobtient si m1 lt m2

ϕ2 =

m1minus1sumk=1

λk

Choix du nombre de valeurs propres crsquoest un problegravemeplus difficile

la regravegle de Kaiser (λk gt 1) ne srsquoapplique plus la regravegle du coude reste valide mais est un peusubjective on peut par contre srsquoaider de la part drsquoinertie expliqueacutee

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 36: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Analyse des correspondances multiples

But on veut eacutetendre lrsquoAFC au cas de p ge 2 variablesX1X2 middot middot middot Xp agrave m1m2 middot middot middot mp modaliteacutes Ceci estparticuliegraverement utile pour lrsquoexploration drsquoenquecirctes ougrave lesquestions sont agrave reacuteponses multiplesProblegraveme lrsquoanalyse des correspondances utilise une tablede contingence qui est difficilement geacuteneacuteralisable au caspgt2Meacutethode on cherche un moyen diffeacuterent de calculer lrsquoAFCpour p = 2 et on veacuterifie que les reacutesultats sontcomparables Si on a de la chance on pourra eacutetendrecette nouvelle version pour pgt2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 37: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les donneacutees

Donneacutees brutes chaque individu est deacutecrit par lesnumeacuteros pour chacune des p variables des modaliteacutes qursquoilpossegravede Il nrsquoest pas possible de faire des calculs sur cetableau ougrave les valeurs sont arbitrairesTableau disjonctif on remplace la jegraveme colonne par mjcolonnes drsquoindicatrices on met un zeacutero dans chaquecolonne sauf celle correspondant agrave la valeur x j

i delrsquoindividu i qui recoit 1Exemple on a trois variables (avec respectivement 3 2 et2 modaliteacutes) mesureacutees sur 4 individus Les tableaux(ci-dessous agrave gauche) sont eacutequivalents aux tableauxdisjonctifs agrave droite

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 38: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif et tableau de contingence

Tableau disjonctif agrave la variable Xj on associe le tableaudisjonctif Xj agrave n lignes et mj colonnesTableau de contingence on veacuterifie facilement que letableau de contingence des variables Xj et Xk est donneacutepar

Njk = X tj Xk

Effectifs marginaux la matrice diagonale des effectifsmarginaux de la variable Xj est donneacutee par

Dj = X tj Xj

Exemple

N21 =

(0 1 21 0 0

)D2 =

(3 00 1

)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 39: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Tableau disjonctif joint

Deacutefinition crsquoest la matrice juxtaposeacutee X = (X1|X2| middot middot middot |Xp)qui possegravede n lignes et m1 + middot middot middot+ mp colonnes On va laconsideacuterer comme un tableau de contingence et luiappliquer une analyse de correspondancesLes lignes la somme des eacuteleacutements de chaque ligne de Xest eacutegale agrave p Le tableau des profils-lignes est donc 1

p XLes colonnes la somme des eacuteleacutements de chaquecolonne de X est eacutegale agrave lrsquoeffectif marginal de la modaliteacutecorrespondante le tableau des profils-colonnes est doncXDminus1 ougrave D est la matrice diagonale par blocs

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 40: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Cas p=2

On applique lrsquoanalyse des correspondances de X oncherche les composantes principales de lrsquoACP encolonnes Elles sont vecteurs propres de

(XDminus1)t 12

X =12

Dminus1X tX

Or on a

X tX =

[X t

1X t

2

] [X1 X2

]=

[X t

1X1 X t1X2

X t2X1 X t

2X2

]=

[D1 NN t D2

]Finalement les composantes principales sont valeurspropres de

12

[Dminus1

1 00 D2

] [D1 NN t D2

]=

12

[Im1 Dminus1

1 NDminus1

2 N t Im2

]Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 41: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Reacutesolution des eacutequations

On note a (resp b) les m1 premiegraveres (resp m2 derniegraveres)coordonneacutees de la composante principale rechercheacutee etmicro la valeur propre correspondante [

Im1 Dminus11 N

Dminus12 N t Im2

] [ab

]= 2micro

[ab

]On obtient les eacutequations

Dminus11 Nb = (2microminus 1)a

Dminus12 N ta = (2microminus 1)b

et donc on retrouve les coordonneacutees des lignes et descolonnes de N dans lrsquoAFC classique (avec λ = (2microminus1)2)

Dminus12 N tDminus1

1 Nb = (2microminus 1)2bDminus1

2 NDminus12 N ta = (2microminus 1)2a

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 42: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

Problegraveme on a a priori m1 + m2 minus 1 valeurs propres nonnulles ce qui est plus important que dans le casclassique En particulier pour chaque λ on a deux micropossibles

micro = 1+radicλ

2 assoceacutee agrave[ab

]micro = 1minus

radicλ

2 assoceacutee agrave[

aminusb

]On ne garde donc que les valeurs micro gt 1 On peut montrerqursquoil y en a min(m1 minus 1m2 minus 1)Interpreacutetation Lrsquointerpreacutetation de la part drsquoinertieexpliqueacutee par les valeurs propres est maintenant tregravesdiffeacuterente En particulier les valeurs propres qui eacutetaienttregraves seacutepareacutees dans lrsquoAFC de N le sont beaucoup moinsdans celle de XPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 43: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Le nombre de valeurs propres

But on cherche agrave faire une repreacutesentation desm1m2 middot middot middot mp comme points drsquoun espace de faibledimensionMeacutethode on fait une AFC sur le tableau disjonctif jointX = (X1|X2| middot middot middot |Xp) qui possegravede n lignes etm1 + m2 + middot middot middot+ mp colonnesLe tableau de Burt crsquoest le tableau B = X tX qui est unsuper-tableau de contingence des variablesX1X2 middot middot middot Xp

ougrave on rappelle que X ti Xi = Di Le tableau de Burt est donc

formeacute de tableaux de contingence et de matricesdrsquoeffectifs marginauxPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 3954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 44: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Exemple de tableau de Burt

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 45: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les coordonneacutees factorielles des cateacutegories

Notation on note a = (a1 middot middot middot ap)t le vecteur agrave

m1 + m2 + middot middot middot+ mp composantes des coordonneacuteesfactorielles des cateacutegories sun axeCalcul de lrsquoAFC sur X comme la matrice desprofils-lignes est 1

p X et celle des profils colonnes XDminus1 aest vecteur propre de

(XDminus1)t 1p

X =1p

Dminus1X tX =1p

Dminus1B

et donc lrsquoeacutequation des coordonneacutees des cateacutegories est1p

Dminus1Ba = microa

avec la convention de normalisation1

npatDa = micro

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 46: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques

Les coordonneacutees des individus soit z le vecteur agrave ncomposantes des coordonneacutees des n individus sur un axefactoriel associeacute agrave la valeur propre micro Drsquoapregraves les reacutesultatsde sur lrsquoAFC on a

z =1radicmicro

1p

Xa

On a donc la normalisation

V (z) =1n

z tz =1

micronp2 atX tXa =1

micronp2 at(pmicroDa) =1

npatDa = micro

Les seuls termes non nuls dans le calcul de Xa sont lescoordonneacutees de la cateacutegorie de chaque variableposseacutedeacutee par lrsquoindividuBarycentre des cateacutegories agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique simpledes coordonneacutees des cateacutegories auxquelles il appartientPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 47: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Formules barycentriques (suite et fin)

On a de mecircme la seconde formule

a =1radicmicro

Dminus1X tz

Les seuls termes non nuls de X tz sont les coordonneacuteesdes individus ayant une modaliteacute donneacuteeBarycentre des individus agrave 1

radicmicro pregraves la coordonneacutee

drsquoun individu est eacutegale agrave la moyenne arithmeacutetique descoordonneacutees des nj individus de cette cateacutegorie

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 48: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Proprieacuteteacutes des valeurs propres

Valeurs propres triviales la valeur propre 1 est associeacutee(comme en AFC) agrave la composante z0 = (1 middot middot middot 1) danslrsquoespace des individus Les autres vecteurs propres luisont orthogonaux et donc de moyenne nulleAutres valeurs propres si n gt

sumpi=1 mi le rang de X estsump

i=1 mi minus p + 1 et le nombre de valeurs propres nontrivialement eacutegales agrave 0 ou 1 est q =

sumpi=1 mi minus p

Somme la somme des valeurs propres non triviales estdonc

qsumk=1

microk = Trace(1p

Dminus1B)minus 1 =1p

psumi=1

mi minus 1 =qp

La moyenne des q valeurs propres vaut 1p

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4454

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 49: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Barycentres et repreacutesentation

Repreacutesentation commune Les points repreacutesentatifs descateacutegories sont barycentres des groupes drsquoindividus Onpeut donc repreacutesenter individus et cateacutegories dans unmecircme plan factorielMoyennes Comme z est une variable de moyenne nullela formule de barycentre indique que pour chaquevariable Xi les coordonneacutees de ses cateacutegories (pondeacutereacutespar les effectifs) sont de moyenne nulle Aucun centragenrsquoest donc neacutecessaireEchelle pour que les cateacutegories se trouvent visuellementau barycentre des individus qui les repreacutesentent on peutremplacer a par

a = Dminus1X tz =radicmicroa

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4554

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 50: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Variables et axes factoriels

Si nj est lrsquoeffectif de la cateacutegorie j et aj sa coordonneacutee surlrsquoaxe factoriel associeacute micro alors

1np

sumjisincateacutegorie

nj(aj)2 = micro

Cateacutegorie la contribution de la cateacutegorie j agrave lrsquoaxe factorielest

1micro

nj

np(aj)

2

inteacuteressante si elle est supeacuterieure au poids njnpVariable la contribution totale de la variable Xi agrave lrsquoaxefactoriel est

1micro

1np

sumj modaliteacute deXi

nj(aj)2

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4654

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 51: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Individus et axes factoriels

La normalisation de z estsumn

i=1(zi)2 = nmicro ougrave zi est la

cordonneacutees de lrsquoindividu i sur lrsquoaxe factoriel associeacute agrave lavaleur propre microContribution drsquoun individu elle est eacutegale pour lrsquoindividu iagrave

1nmicro

(zi)2

Cette contribution est jugeacutee en la comparant au poids 1nQualiteacute de la repreacutesentation pour le sous-espace formeacutepar les l premiers axes crsquoest le cosinus carreacute habituelsuml

k=1(z(k)i )2sumq

k=1(z(k)i )2

ougrave lrsquoexposant (k) correspond aux diffeacuterents axes factorielsPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4754

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 52: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale

Soit xj = (x jj ) le vecteur colonne de X correspondant agrave

une cateacutegorie j On rappelle que lrsquoinertie totale vaut

sumjisincateacutegorie

nj

npd2(j g) =

1p

psumi=1

mi minus 1

La distance du profil-colonne j au centre de graviteacute desprofils-colonnes g=1n est

d2(j g) =nsum

i=1

npp(x j

injminus 1

n)2 = n

nsumi=1

(x j

i

n2j+

1n2 minus

2x ji

nnj)

=nnjminus 1

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4854

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 53: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Contribution agrave lrsquoinertie totale (suite et fin)

Contribution drsquoune cateacutegorie la contribution absolue dela cateacutegorie agrave lrsquoinertie est

nj

npd2(j g) =

1p(1minus

nj

n)

qui est une fonction deacutecroissante de lrsquoeffectif Il faut donteacuteviter les cateacutegories drsquoeffectif trop faible qui drsquoailleurs seretrouveront dans les premiers axesContribution drsquoune variable la contribution de la variableXi est sum

j modaliteacute deXi

1p(1minus

nj

n) =

mi minus 1p

Elle est drsquoautant plus grande que le nombre de modaliteacuteest eacuteleveacute Il faut donc eacuteviter les dispariteacutes trop grandesentre les modaliteacutes (quand on a le choix du deacutecoupage)Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 4954

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 54: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Les variables suppleacutementaires

Leur usage est tregraves courant en analyse descorrespondances multiplesVariables qualitatives on les place directement sur laprojection sur un plan factoriel en utilisant la formule debarycentre des individus si on veut placer une variablesuppleacutementaire de tableau disjonctif Xsup et drsquoeffectifsmarginaux Dsup on calcule les coordonneacutees de sesmodaliteacutes sur un axe principal par

asup =1radicmicro

Dminus1supX primesupz

Variables quantitatives on calcule agrave la main leurcorreacutelation avec les axes factoriels et on les place sur uncercle de correacutelations On peut aussi les deacutecouper enclasses et les traiter comme des variables qualitativesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5054

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 55: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Valeurs-test pour les variablessuppleacutementairesBut on cherche agrave savoir si une variable suppleacutementaireest lieacutee agrave un axe donneacuteIdeacutee du calcul si les ni individus drsquoune cateacutegorie eacutetaientpris au hasard la moyenne de leurs coordonneacutees seraitune variable aleacuteatoire centreacutee (les z sont de moyennenulle) et de variance micro

nj

nminusnjnminus1 De plus la moyenne des

coordonneacutees est eacutegale agrave microaj Valeur-test crsquoest la version centreacutee et reacuteduite de lamoyenne des coordonneacutees

ajradic

nj

radicn minus 1n minus nj

Quand nj est assez grand elle est significative si elle estsupeacuterieure agrave 2 ou 3 On ne doit pas lrsquoutiliser sur lesvariables activesPr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5154

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 56: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Pratique de lrsquoanalyse des correspondancesmultiples

Seacutelection des variables on deacutecide souvent de ne garderqursquoun nombre reacuteduit de variables actives et de garder lesautres comme variables suppleacutementairesSeacutelection des axes

regravegle courante garder les axes tels que micro gt 1p (lamoyenne des valeurs propres est 1p )les axes inteacuteressants sont ceux que lrsquoon peut interpreacuteteren regardant les contributions des variables actives etles valeurs-tests associeacutees aux variablessuppleacutementairesen pratique on se contente souvent drsquointerpreacuteter lepremier plan principal

Inertie expliqueacutee elle est moins inteacuteressante qursquoen ACP

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5254

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 57: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5354

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM
Page 58: Analyse Factorielle des Correspondances (AFC)analyse des correspondances simples, est une méthode exploratoire d’analyse des tableaux de contingence. Elle a été développée par

Introduction

Variablesqualitatives

Tableau decontingence

Marges et profils

Proprieacuteteacutes desprofils

Le X 2 drsquoeacutecart agravelrsquoindeacutependance

Caractegraveresignificatif duX 2

Analyse des cor-respondancesde deuxvariables lesdonneacutees

Repreacutesentationgeacuteomeacutetrique desprofils

Commenteacutetudier cesdonneacutees

La meacutetrique duX

Pourquoi lameacutetrique duX 2

Autresproprieacuteteacutes de lameacutetrique du duX 2

ACP des deuxnuages deprofils

g est un facteurprincipal

Calcul de lrsquoACP

Comparaisonlignes-colonnes

Interpreacutetationdes reacutesultats

Contributions agravelrsquoinertie

Formules detransition

Deacutecompositionde lrsquoinertie

Analyse des cor-respondancesmultiples

Les donneacutees

Tableaudisjonctif ettableau decontingence

Tableaudisjonctif joint

Cas p=2

Reacutesolution deseacutequations

Le nombre devaleurs propres

Le cas geacuteneacuteralp gt 2

Exemple detableau de Burt

Lescoordonneacuteesfactorielles descateacutegories

Formulesbarycentriques

Formulesbarycentriques

Proprieacuteteacutes desvaleurs propres

Barycentres etrepreacutesentation

Variables et axesfactoriels

Individus et axesfactoriels

Contribution agravelrsquoinertie totale

Les variablessuppleacutementaires

Valeurs-testpour lesvariablessuppleacutementaires

Pratique delrsquoanalyse descorrespon-dancesmultiples

Points communsentre AFC etACM

Diffeacuterencesentre AFC etACM

Points communs entre AFC et ACM

Pr Ousmane THIARE Analyse Factorielle des Correspondances (AFC) 16 avril 2020 5454

  • Introduction
  • Variables qualitatives
  • Tableau de contingence
  • Marges et profils
  • Proprieacuteteacutes des profils
  • Le X2 deacutecart agrave lindeacutependance
  • Caractegravere significatif du X2
  • Analyse des correspondances de deux variables les donneacutees
  • Repreacutesentation geacuteomeacutetrique des profils
  • Comment eacutetudier ces donneacutees
  • La meacutetrique du X
  • Pourquoi la meacutetrique du X2
  • Autres proprieacuteteacutes de la meacutetrique du du X2
  • ACP des deux nuages de profils
  • g est un facteur principal
  • Calcul de lACP
  • Comparaison lignes-colonnes
  • Interpreacutetation des reacutesultats
  • Contributions agrave linertie
  • Formules de transition
  • Deacutecomposition de linertie
  • Analyse des correspondances multiples
  • Les donneacutees
  • Tableau disjonctif et tableau de contingence
  • Tableau disjonctif joint
  • Cas p=2
  • Reacutesolution des eacutequations
  • Le nombre de valeurs propres
  • Le cas geacuteneacuteral pgt2
  • Exemple de tableau de Burt
  • Les coordonneacutees factorielles des cateacutegories
  • Formules barycentriques
  • Formules barycentriques
  • Proprieacuteteacutes des valeurs propres
  • Barycentres et repreacutesentation
  • Variables et axes factoriels
  • Individus et axes factoriels
  • Contribution agrave linertie totale
  • Les variables suppleacutementaires
  • Valeurs-test pour les variables suppleacutementaires
  • Pratique de lrsquoanalyse des correspondances multiples
  • Points communs entre AFC et ACM
  • Diffeacuterences entre AFC et ACM