View
219
Download
0
Category
Preview:
Citation preview
MeS
S2
01
5O1
Au-delà de MeSS
• Méthodologie
- Pilier de toutes les démarches (scientifiques)
• Méthodes empiriques et statistiques
- Compétences très demandées
- Enquêtes, travaux basé sur des statistiques, évaluations en tout genre- Logiciels statistiques
- Pratique en lien avec un domaine d’application spécifique
→ Suites à votre formation de base
MeS
S2
01
5O2
Suites à votre formation de base
• Approfondissement
- Analyse de données catégorielles
- Régression et modélisation
- Analyses multidimensionnelles et classification
• Spécialisation
- Techniques particulières
- Données particulières: Temps, espace, documents, réseaux, événements…
• Compétences pratiques
- Saisie et collecte des données
- Logiciels statistiques
• Lieux
- Enseignements avancés (BA, MA, écoles doctorales)
- Ecoles d’été/cours spécialisés
MeS
S2
01
5O3
Variables indépendante(s)V
aria
ble
dépe
nda
nte
Nominal Ordinal Intervalles
Nominal
Ordinal
Intervalles
Outils pour l’analyse (orientation “modélisation”)
Dichotomique
Dichotomique
Tableaux de moyennes/ANOVA Régression
Tableaux croisés/Régression logistique
Tableaux croisés/Régression multinomiale
Tableaux croisésRégression ordinale
Régression avec var. dichotomiques
MeS
S2
01
5O4
Régression: Extensions/variantes
• Régression- Linéaire: y = b0 + b1•X1 + b2•X2
- Non-Linéaire: y = b0 + b1•X1 + b2•X12 + b3•X2
3
- Méthodes: Moindres carrés [OLS], moindres carrés pondérés (WLS), maximum devraisemblance [Maximum likelihood],...
- Avec variables catégorielles (variables binaires)
- Régressions logistiques
- Variable dépendante dichotomique (0,1), par exemple (vote, ne vote pas)- Estimer la probabilité d’aller voter
- Variable dépendante nominale- Estimer la probabilité d’appartenir à une catégorie
• Et encore...- SEM Equations structurelles et logiciels spécialisés (Amos, Lisrel, ...)
- Modèle linéaire généralisé [GLM = General Linear Model]
- Analyse de la variance
- Analyse multi-niveau (modèles hiérarchiques)
- Etudier les effets des variables à chaque niveau et les interactions entre niveaux
- ....
X3
Y
X1
X2
MeS
S2
01
5O5
Autres techniques statistiques
• Analyses dimensionnelles- Analyse en composantes principales
- Analyse factorielle, analyse factorielle des correspondances
- Multidimensional scaling
• Classification et variantes- Classification hiérarchique et non-hiérarchique [Cluster analysis]
- Arbres de classification
- Recherches des variables les plus discriminantes par rapport à une variable dépendante (conti-nue ou catégorielle)
- Analyse discriminante
- Segmentation
• ...
MeS
S2
01
5M
od
ule
IIIT132
Ob
serv
ati
on
s
Variables Résumés
Résu
més
Dimensions
Dimensions
Analyses dimensionnelles
• Réduction de la complexité → moins de variables- Résumer la variabilité commune des variables?
• Résultats- Echelles des variables- Echelles des observations (scores) [variable continue]
• Questions- Combien de dimensions?- Quelle méthodes choisir?
• Familles de méthodes- Analyse en composantes principales (ACP) et- Analyses factorielles et analyses factorielles des correspondances (AFC)- Multidimensional scaling,...
• Utilisation en régression- En cas de forte multi-colinéarité (fortes corrélations entre variables indépendantes)
- Les remplacer par la première composante principale des variables concernées
Ŷ = b0 + b1X1 + b2X2 + b3X3+ b4X4 + b5X5 + b6X6 + b7X7
Ŷ = b0 + b1X1 + b2X2 + b3CP
MeS
S2
01
5M
od
ule
IIIT133
Extraction Method: Principal Component Analysis. 3 components extracted.
corrélations avec les facteurs Dimension
1 2 3
Asile: Modification de la loi [ModAsil] .97
Naturalisations facilitées (3e génération) [Natur3] -.95
Immigration clandestine [ImmigC] .95
Naturalisations facilitées (2e génération) [Natur2] -.93
Initiative pour une réglementation de l'asile[Rasile] .92
Initiative contre les abus dans le droit d'asile[AbusAsil] .90
Initiative contre la construction de minarets[Minarets] .90
Asile: Mesure d'urgences [Uasile] .88 .32
Loi sur l'asile [Lasile] .86 .37
Initiative "Etre solidaire" [Solidaire] -.81
Asile: Revision de la loi [Asile] .66 .43
Limititation de l'Immigration [LimIm] .89
Naturalisations facilitées[NaturFacil] -.34 .91
% de variance expliquée 68% 11% 8%
Analyse de votations (problématique de l’immigration)
Analyse en composantes principalesVotations
Cantons
MeS
SM
od
ule
III
S14
Classes, groupes, partitions
• Conventionnelles• Exemple: Continents
- Problèmes de définition: Qu’est-ce qu’un continent? Une masse de terres entourée d’eau, suffisammentimportante?
• Nomenclatures• CSP, professions (BIT, OFS,...)
• Typologies• Type de communes (OFS)
• Définition des classes
- Basée sur des définitions théoriques
- Variable catégorielle (év. construites)
- Découpage d’une variable continue (p.ex. Pays riches/pays pauvres basé sur PNB/hab.)
- Recodage d’une dimension issue d’une ACP
• Classification automatique (cluster analysis)• Méthodes statistiques
MeS
S2
01
5M
od
ule
IIIT135
• Démarche- Groupes des objets qui se ressemblent
- Observations, variables, corrélations,... (objets)
• Résultat- Variable nominale = appartenance au groupe (classe, partition,...)
• Interprétation- Caractériser, nommer les groupes, “signification”
• Problèmes à résoudre- Comment mesurer la ressemblance (proximité/distance entre objets)- Combien de groupes définir?- Quelle méthodes choisir?
• Familles de méthodes- Hiérarchiques
- Fusion successive des objets les plus similaires- Non-hiérarchiques (agglomératives)
- Agglomération des objets les plus similaires autour de centres mobiles
• Analyse des résultats d’une classification- Outils usuels (tableaux, boxplots,...)- Analyse discriminante, régression logistique, arbres de segmentation- ...
Ob
serv
ati
on
s
Variables Résumés
Résu
més
Groupes/classes
Groupes/classes
Classification automatique (Cluster analysis)
MeS
S2
01
5M
od
ule
IIIT136
• Classification hiérarchique- Algorithme général
(0) Début: Chaque objet forme un groupe séparé(1) Fusionner les objets les plus proches (distance minimale, objets les plus ressemblants)(2) Calcul de la valeur (coordonnées) du nouvel objet, résultant de la fusion de 2 objets(3) Répéter (2) et (3) jusqu’à fusion de tous les objets en un seul objet.
- Représentation graphique: Arbre hiérarchique (dendrogramme)- Problèmes à résoudre
- Ne produit pas de classes (l’utilisateur doit découper l’arbre)- Mesure de ressemblance/distance entre objets- Calcul de la valeur des objets fusionnés
- Nombreuses variantes: Ward, voisin le plus proche, voisin le plus éloigné,...
• Classification agglomérative (non-hiérarchique)- Algorithme général
(1) Choisir le nombre de groupes (classes) à définir(2) Choisir une configuration de départ (centres initiaux des groupes)(3) Allouer tous les objets au centre le plus proche.(4) Calculer pour chaque groupe un nouveau centre à partir de tous les objets du groupe(5) Répéter (3) -(4) jusqu’à ce qu’aucun objet ne change de groupe.
- Problèmes à résoudre- Nombre de classes à définir (choix a priori!)- Mesure de ressemblance/distance entre objets- Allocation des objets aux centres
- Nombreuses variantes: K-Means,Forgy, Jancey,...
Méthodes de classification
MeS
S2
01
5M
od
ule
IIIT137Classification hiérarchique (votations problématique immigration)
Classification des variables (votations) Classification des observations (cantons)
• Classification?
- Découpage de l’arbre hiérarchique(dendrogramme)
- Critère groupes clairement distincts
Arbres hiérarchiques (dendrogrammes)
MeS
S2
01
5M
od
ule
IIIT138Interprétation d’une classification: Comparer les 2 groupes de la classification hiérarchique
MeS
S2
01
5O7
Ob
serv
atio
ns
VariablesRésumés
Rés
umés
- Dimensions- Groupes (Classes)
- [Dimensions]- Groupes (classes)
••
•
•
•
•
••
•
•
••
•UK S
CH
CanadaMalawi
Niger
Ruanda
BanglaDesh
Dimensions
GroupesClasses
Classification
Analyses dimensionnelles
MeS
S2
01
5O6
Exemple simple pour deux variables et deux groupes seulement!
×××
×
××
××
××
×
×
×××
×
××
××
××
×
×
•
• ••
•••
••
••
•
•
• ••
•••
••
••
•
•
• •
•
•••
••
••
•
•
• •
•••
••
••
•
•
• ••
•
••
•••
•
•
• •••
••
••
••
•
•
•
••
••
•
•••
••
•
•
××
× ×
××
×
×
× ×
××
××
× ×
××
×
×
× ×
××
•
•••
•• •
•••
•
••
•••
•• •
•••
•
••
•••
•• •
•••
•
••
•••
• •••
••
••
•••
•
• ••
••
••
••
•
•• •
•••
••
•
••
••
••
••
•
•
•
Analyse discriminante
• Quelles variables discriminent des groupes (classes)
MeS
S2
01
5O9
PNB/hab-P
ays 1
PNB/Hap-P
ays 2
Pays1-Pays2 Année1980Pays1-Pays2 Année1981Pays1-Pays2 Année1982
“dyades de pays”Type
deconfli
t
Données sur les conflits
Analyse de données dyadiques
• Par exemple: Études de conflits, couples, ...
Nombre
d’incid
ents
MeS
S2
01
5O10
Analyse de données spatiales
• Données spatiales (données géoréférées)- Toute observation (commune, personne,
événement,…) peut avoir une référence spatiale
- Comme les données temporelles: observationsnon-indépendantes (pays voisins, ...)
• Outils- Cartographie, SIG [GIS] (système d’info.
géographiques)
- Modèles spatiaux
- Lissage spatial
- ...
• PotentielAssocié à d’autres types de données: individuelles, temporelles, …
- Etude de mobilité, dynamique, évolution
- Etude de réseaux
• Tendances- Géoréférences → Google Earth, Virtual Earth, ...
1900 2000
ID PNB/h
1 Andorre
10 Botswana 4
Matrice de données
Temps
GeoréférenceGeoréférence
MeS
S2
01
5O11
Compétences pratiques à développer
• Collecte et saisie des données
- Techniques des enquêtes: rédaction de questionnaires, organisation d’enquêtes
- Saisie, vérification et documentation des données
• Logiciels statistiques (SPSS, R, SAS, Stata, Minitab, Statistica,...)
- Utilisateur/trice avancé/e
- Outils statistiques plus complexes, spécialisation- Gestion des données: Création de fichiers, saisie et vérification des données, fusion de fichiers,…- Transformations complexes- Production et gestion des sorties (styles, etc)- Préparation des tableaux et graphiques pour publication (papier, internet, présentations)
- Spécialiste
- Tâches complexes: Création de macros, langage matriciel, langage graphique- Création de nouveaux outils: Programmation en Python, R,…
MeS
S2
01
5O12
Analyse de réseaux (sociaux) [Network Analysis]
• Exemples- Influence politique des membres du Conseil National
- Relations entre Etats, organisation
- Réseaux sociaux: famille, connaissances, internet (e-mails, Facebook, Twitter &Co)
• Données- Individuelles: Membre de commissions parlementaires, nombre de conseils
d’administration, parti politique, profession,...
- Relationnelles: Contact, lien avec d’autres personnes (nature, intensité,...)
• Analyse- Carte du réseau (graphe)
- Position dans le réseau (centralité, ...)
- Fréquence et intensité des contacts
- Influence (pouvoir) de la personne
- ...
• Logiciels spécialisés- Ucinet, Pajek,...
MeS
S2
01
5O15Analyse de données qualitatives (textuelles)
• Méthodologies (univers théoriques)- Analyse de discours, herméneutique, phénoménologie, ethnographie, anthropologie,...- Analyse de média- Mixed methods, triangulation
• Documents, “Données”- Textes, discours, entretiens semi-directifs, entretien en profondeur, messages
électroniques, réseaux sociaux (Facebook LinkedIn,...), focus groups, …
- Images (photos, dessins, peintures,...), sons, vidéos, artefacts (archéologiques,...)
• Préparation pour l’analyse- Codage des documents
• Analyse- Analyse de contenu
- Analyse lexicale- Analyse statistique- ...
- Analyses qualitatives
- Analyse conceptuelle (ex. Analyse conversationnelle, grounded theory,...)
• Logiciels spécialisés- Nvivo, Atlas-ti, WordStat, MaxQDA, QDAMiner, LexiQuest, ...
MeS
S2
01
5O16
jhh ddjashdjas hdjash djhdsah dsajhd sdhdjashd d dhj sddajhsd hdjashdsjdhjashd sdjahdsa sd s sd ds adsd asd ewqe wqe ew as d sadasdas ads asdasd as asd das d sad asdasd dasd asd asd asd as ad a das dsa d sd sd as dsa dsasdas dsa dsad asd asd asd asd as das d ads a d asd asd adsad asd s das sd dssd sd sda das ew k kj kj kj kj kj kj kj j nmnb h jh hg gh n bnb n bh zuj jh j hjb n g fr th gfg f gf jhhg hj hj gh h gh ghghhg hg 7 tz t qw qw2q w dasd A SDADSA DS dsa d sad dsA D D C XY DSA DSA SAD DASD D SA DAS D SD S SD S D DS SD SDS SDA DSWDFD SDA DF SADF SDA DSA SDA DAS SDA DAS DWDS SD SD SD W SD S DS D SD W2 DS DAS QASDWQ D SA S DAS D ASD ASD W SD S SD Wqwqwqwqw wq wqfrefsaf fds fdsff dfe edde de erresd ddsdsdsd sdr3 fhjhdfjh fd df dfds sdfsd sfsdf sdsd sdsd sds
Documents à analyser Mots
Coder des segments
Analyse de contenu [content analysis]
Matricede données
Analyse statistique
• Fréquences, co-occurrences• Analyses dimensionnelles• Classification• .....
Mise en relation des codesRéseaux de codes (concepts)
“Theory Building”
Word crunching
• Manuel• Automatique (dictionnaire)
(Corpus)
“Statistique textuelle”
Référence à l’histoire
Justifie
con
séq
uen
ceasso
ciation
Valeurs suisses
Concept-x
Concept-y
MeS
S2
01
5O17
PhraseNo
Phrases UDC SocialismeIntensitéAttaque
NationalSocialisme
1 Dans le point de la situation politique que j'ai fait à l'occasion du 12e con-grès annuel de l'Albisgüetli du 21 janvier 2000 et que j'ai ensuite envoyé àtous les ménages suisses, j'ai textuellement dit ceci:
Non Non 0 Non
2 «A l'heure actuelle, ce sont les socialistes qui remportent la palme en mat-ière de manque de crédibilité: le socialisme, tant applaudi par ceux quinous critiquent, a vécu en 1989 son effondrement économique, politique etmoral complet.
Non Oui 6 Non
3 De nos jours, les socialistes échoués cherchent à détourner l'attention dupublic, en traitant à la légère de fascistes d'autres partis politiques.
Non Oui 0 Non
4 Les socialistes ont-ils donc oublié que la Suisse a défendu entre 1933 et1945 la souveraineté, la neutralité, la démocratie directe et le fédéralismecontre le raz-de-marée brun?
Non Oui 5 Oui
5 L'UDC, qui était à l'époque au premier rang, défend encore aujourd'huices valeurs comme aucun autre parti politique denotre pays.
Oui Non 0 Non
6 C'est précisément la gauche, qui méprise ces valeurs, qui se permet main-tenant de reprocher à l'UDC des idéologies extrémistes.
Oui Oui 3 Non
7 Nos adversaires souhaitent occulter le fait qu'il n'existe pas la moindre dif-férence entre les responsables bruns et rouges des génocides commis ausiècle passé.
Non Oui 8 Oui
8 Ceux, parmi les socialistes, qui traitent à l'heure actuelle si légèrement au-trui de fascistes devraient réaliser que leur adoration de l'état omnipotent,que leur fixation sur la collectivité et leur mépris de la liberté de l'individuse rapprochent nettement plus des idéologies fascistes que notre vision dumonde.
Non Oui 4 Oui
Création d’un tableau de données à partir de segments identifiés (codage)
Discours de C. Blocher
MeS
S2
01
5O18
Dans le point de la situation politique que j'ai fait à l'occasiondu 12e congrès annuel de l'Albisgüetli du 21 janvier 2000 etque j'ai ensuite envoyé à tous les ménages suisses, j'ai tex-tuellement dit ceci:«A l'heure actuelle, ce sont les socialistesqui remportent la palme en matière de manque de crédibilité:le socialisme, tant applaudi par ceux qui nous critiquent, avécu en 1989 son effondrement économique, politique etmoral complet. De nos jours, les socialistes échoués cherch-ent à détourner l'attention du public, en traitant à la légère defascistes d'autres partis politiques. Les socialistes ont-ilsdonc oublié que la Suisse a défendu entre 1933 et 1945 lasouveraineté, la neutralité, la démocratie directe et le fédéral-isme contre le raz-de-marée brun? L'UDC, qui était àl'époque au premier rang, défend encore aujourd'hui ces va-leurs comme aucun autre parti politique denotre pays. C'estprécisément la gauche, qui méprise ces valeurs, qui se permetmaintenant de reprocher à l'UDC des idéologies extrémistes.Nos adversaires souhaitent occulter le fait qu'il n'existe pas lamoindre différence entre les responsables bruns et rouges desgénocides commis au siècle passé. Ceux, parmi les social-istes, qui traitent à l'heure actuelle si légèrement autrui de fas-cistes devraient réaliser que leur adoration de l'étatomnipotent, que leur fixation sur la collectivité et leur méprisde la liberté de l'individu se rapprochent nettement plus desidéologies fascistes que notre vision du monde. Ce n'est paspar hasard que les hordes brunes ont choisi de s'appeler 'na-tional-socialistes‘ [...].[2]
ValeursSuissesSegment de texte 1Coder
Index
Discours de C. Blocher
Segment de texte 2
Socialisme
Adversaire
RéférenceHistorique
Codes, mots-clé, tags
Lien
Coder
Recommended