27
MeSS 2015 O1 Au-delà de MeSS • Méthodologie - Pilier de toutes les démarches (scientifiques) • Méthodes empiriques et statistiques - Compétences très demandées - Enquêtes, travaux basé sur des statistiques, évaluations en tout genre - Logiciels statistiques - Pratique en lien avec un domaine d’application spécifique Suites à votre formation de base

- Pilier de toutes les démarches (scientifiques ... · - Ecoles d’été/cours spécialisés. M e S S 2 0 1 5 O3 ... • Utilisation en régression ... (SPSS, R, SAS, Stata, Minitab,

Embed Size (px)

Citation preview

MeS

S2

01

5O1

Au-delà de MeSS

• Méthodologie

- Pilier de toutes les démarches (scientifiques)

• Méthodes empiriques et statistiques

- Compétences très demandées

- Enquêtes, travaux basé sur des statistiques, évaluations en tout genre- Logiciels statistiques

- Pratique en lien avec un domaine d’application spécifique

→ Suites à votre formation de base

MeS

S2

01

5O2

Suites à votre formation de base

• Approfondissement

- Analyse de données catégorielles

- Régression et modélisation

- Analyses multidimensionnelles et classification

• Spécialisation

- Techniques particulières

- Données particulières: Temps, espace, documents, réseaux, événements…

• Compétences pratiques

- Saisie et collecte des données

- Logiciels statistiques

• Lieux

- Enseignements avancés (BA, MA, écoles doctorales)

- Ecoles d’été/cours spécialisés

MeS

S2

01

5O3

Variables indépendante(s)V

aria

ble

dépe

nda

nte

Nominal Ordinal Intervalles

Nominal

Ordinal

Intervalles

Outils pour l’analyse (orientation “modélisation”)

Dichotomique

Dichotomique

Tableaux de moyennes/ANOVA Régression

Tableaux croisés/Régression logistique

Tableaux croisés/Régression multinomiale

Tableaux croisésRégression ordinale

Régression avec var. dichotomiques

MeS

S2

01

5O4

Régression: Extensions/variantes

• Régression- Linéaire: y = b0 + b1•X1 + b2•X2

- Non-Linéaire: y = b0 + b1•X1 + b2•X12 + b3•X2

3

- Méthodes: Moindres carrés [OLS], moindres carrés pondérés (WLS), maximum devraisemblance [Maximum likelihood],...

- Avec variables catégorielles (variables binaires)

- Régressions logistiques

- Variable dépendante dichotomique (0,1), par exemple (vote, ne vote pas)- Estimer la probabilité d’aller voter

- Variable dépendante nominale- Estimer la probabilité d’appartenir à une catégorie

• Et encore...- SEM Equations structurelles et logiciels spécialisés (Amos, Lisrel, ...)

- Modèle linéaire généralisé [GLM = General Linear Model]

- Analyse de la variance

- Analyse multi-niveau (modèles hiérarchiques)

- Etudier les effets des variables à chaque niveau et les interactions entre niveaux

- ....

X3

Y

X1

X2

MeS

S2

01

5O5

Autres techniques statistiques

• Analyses dimensionnelles- Analyse en composantes principales

- Analyse factorielle, analyse factorielle des correspondances

- Multidimensional scaling

• Classification et variantes- Classification hiérarchique et non-hiérarchique [Cluster analysis]

- Arbres de classification

- Recherches des variables les plus discriminantes par rapport à une variable dépendante (conti-nue ou catégorielle)

- Analyse discriminante

- Segmentation

• ...

MeS

S2

01

5M

od

ule

IIIT132

Ob

serv

ati

on

s

Variables Résumés

Résu

més

Dimensions

Dimensions

Analyses dimensionnelles

• Réduction de la complexité → moins de variables- Résumer la variabilité commune des variables?

• Résultats- Echelles des variables- Echelles des observations (scores) [variable continue]

• Questions- Combien de dimensions?- Quelle méthodes choisir?

• Familles de méthodes- Analyse en composantes principales (ACP) et- Analyses factorielles et analyses factorielles des correspondances (AFC)- Multidimensional scaling,...

• Utilisation en régression- En cas de forte multi-colinéarité (fortes corrélations entre variables indépendantes)

- Les remplacer par la première composante principale des variables concernées

Ŷ = b0 + b1X1 + b2X2 + b3X3+ b4X4 + b5X5 + b6X6 + b7X7

Ŷ = b0 + b1X1 + b2X2 + b3CP

MeS

S2

01

5M

od

ule

IIIT133

Extraction Method: Principal Component Analysis. 3 components extracted.

corrélations avec les facteurs Dimension

1 2 3

Asile: Modification de la loi [ModAsil] .97

Naturalisations facilitées (3e génération) [Natur3] -.95

Immigration clandestine [ImmigC] .95

Naturalisations facilitées (2e génération) [Natur2] -.93

Initiative pour une réglementation de l'asile[Rasile] .92

Initiative contre les abus dans le droit d'asile[AbusAsil] .90

Initiative contre la construction de minarets[Minarets] .90

Asile: Mesure d'urgences [Uasile] .88 .32

Loi sur l'asile [Lasile] .86 .37

Initiative "Etre solidaire" [Solidaire] -.81

Asile: Revision de la loi [Asile] .66 .43

Limititation de l'Immigration [LimIm] .89

Naturalisations facilitées[NaturFacil] -.34 .91

% de variance expliquée 68% 11% 8%

Analyse de votations (problématique de l’immigration)

Analyse en composantes principalesVotations

Cantons

MeS

S2

01

5M

od

ule

IIIT134Analyse des résultats: Etudier les liens avec la Ière dimension de l’ACP

MeS

SM

od

ule

III

S14

Classes, groupes, partitions

• Conventionnelles• Exemple: Continents

- Problèmes de définition: Qu’est-ce qu’un continent? Une masse de terres entourée d’eau, suffisammentimportante?

• Nomenclatures• CSP, professions (BIT, OFS,...)

• Typologies• Type de communes (OFS)

• Définition des classes

- Basée sur des définitions théoriques

- Variable catégorielle (év. construites)

- Découpage d’une variable continue (p.ex. Pays riches/pays pauvres basé sur PNB/hab.)

- Recodage d’une dimension issue d’une ACP

• Classification automatique (cluster analysis)• Méthodes statistiques

MeS

S2

01

5M

od

ule

IIIT135

• Démarche- Groupes des objets qui se ressemblent

- Observations, variables, corrélations,... (objets)

• Résultat- Variable nominale = appartenance au groupe (classe, partition,...)

• Interprétation- Caractériser, nommer les groupes, “signification”

• Problèmes à résoudre- Comment mesurer la ressemblance (proximité/distance entre objets)- Combien de groupes définir?- Quelle méthodes choisir?

• Familles de méthodes- Hiérarchiques

- Fusion successive des objets les plus similaires- Non-hiérarchiques (agglomératives)

- Agglomération des objets les plus similaires autour de centres mobiles

• Analyse des résultats d’une classification- Outils usuels (tableaux, boxplots,...)- Analyse discriminante, régression logistique, arbres de segmentation- ...

Ob

serv

ati

on

s

Variables Résumés

Résu

més

Groupes/classes

Groupes/classes

Classification automatique (Cluster analysis)

MeS

S2

01

5M

od

ule

IIIT136

• Classification hiérarchique- Algorithme général

(0) Début: Chaque objet forme un groupe séparé(1) Fusionner les objets les plus proches (distance minimale, objets les plus ressemblants)(2) Calcul de la valeur (coordonnées) du nouvel objet, résultant de la fusion de 2 objets(3) Répéter (2) et (3) jusqu’à fusion de tous les objets en un seul objet.

- Représentation graphique: Arbre hiérarchique (dendrogramme)- Problèmes à résoudre

- Ne produit pas de classes (l’utilisateur doit découper l’arbre)- Mesure de ressemblance/distance entre objets- Calcul de la valeur des objets fusionnés

- Nombreuses variantes: Ward, voisin le plus proche, voisin le plus éloigné,...

• Classification agglomérative (non-hiérarchique)- Algorithme général

(1) Choisir le nombre de groupes (classes) à définir(2) Choisir une configuration de départ (centres initiaux des groupes)(3) Allouer tous les objets au centre le plus proche.(4) Calculer pour chaque groupe un nouveau centre à partir de tous les objets du groupe(5) Répéter (3) -(4) jusqu’à ce qu’aucun objet ne change de groupe.

- Problèmes à résoudre- Nombre de classes à définir (choix a priori!)- Mesure de ressemblance/distance entre objets- Allocation des objets aux centres

- Nombreuses variantes: K-Means,Forgy, Jancey,...

Méthodes de classification

MeS

SM

od

ule

III

S16

Similaires? Différents?

MeS

S2

01

5M

od

ule

IIIT137Classification hiérarchique (votations problématique immigration)

Classification des variables (votations) Classification des observations (cantons)

• Classification?

- Découpage de l’arbre hiérarchique(dendrogramme)

- Critère groupes clairement distincts

Arbres hiérarchiques (dendrogrammes)

MeS

S2

01

5M

od

ule

IIIT138Interprétation d’une classification: Comparer les 2 groupes de la classification hiérarchique

MeS

S2

01

5O7

Ob

serv

atio

ns

VariablesRésumés

Rés

umés

- Dimensions- Groupes (Classes)

- [Dimensions]- Groupes (classes)

••

••

••

•UK S

CH

CanadaMalawi

Niger

Ruanda

BanglaDesh

Dimensions

GroupesClasses

Classification

Analyses dimensionnelles

MeS

S2

01

5O6

Exemple simple pour deux variables et deux groupes seulement!

×××

×

××

××

××

×

×

×××

×

××

××

××

×

×

• ••

•••

••

••

• ••

•••

••

••

• •

•••

••

••

• •

•••

••

••

• ••

••

•••

• •••

••

••

••

••

••

•••

••

××

× ×

××

×

×

× ×

××

××

× ×

××

×

×

× ×

××

•••

•• •

•••

••

•••

•• •

•••

••

•••

•• •

•••

••

•••

• •••

••

••

•••

• ••

••

••

••

•• •

•••

••

••

••

••

••

Analyse discriminante

• Quelles variables discriminent des groupes (classes)

MeS

S2

01

5O8

Autres types de données

MeS

S2

01

5O9

PNB/hab-P

ays 1

PNB/Hap-P

ays 2

Pays1-Pays2 Année1980Pays1-Pays2 Année1981Pays1-Pays2 Année1982

“dyades de pays”Type

deconfli

t

Données sur les conflits

Analyse de données dyadiques

• Par exemple: Études de conflits, couples, ...

Nombre

d’incid

ents

MeS

S2

01

5O10

Analyse de données spatiales

• Données spatiales (données géoréférées)- Toute observation (commune, personne,

événement,…) peut avoir une référence spatiale

- Comme les données temporelles: observationsnon-indépendantes (pays voisins, ...)

• Outils- Cartographie, SIG [GIS] (système d’info.

géographiques)

- Modèles spatiaux

- Lissage spatial

- ...

• PotentielAssocié à d’autres types de données: individuelles, temporelles, …

- Etude de mobilité, dynamique, évolution

- Etude de réseaux

• Tendances- Géoréférences → Google Earth, Virtual Earth, ...

1900 2000

ID PNB/h

1 Andorre

10 Botswana 4

Matrice de données

Temps

GeoréférenceGeoréférence

MeS

S2

01

5O11

Compétences pratiques à développer

• Collecte et saisie des données

- Techniques des enquêtes: rédaction de questionnaires, organisation d’enquêtes

- Saisie, vérification et documentation des données

• Logiciels statistiques (SPSS, R, SAS, Stata, Minitab, Statistica,...)

- Utilisateur/trice avancé/e

- Outils statistiques plus complexes, spécialisation- Gestion des données: Création de fichiers, saisie et vérification des données, fusion de fichiers,…- Transformations complexes- Production et gestion des sorties (styles, etc)- Préparation des tableaux et graphiques pour publication (papier, internet, présentations)

- Spécialiste

- Tâches complexes: Création de macros, langage matriciel, langage graphique- Création de nouveaux outils: Programmation en Python, R,…

MeS

S2

01

5O12

Analyse de réseaux (sociaux) [Network Analysis]

• Exemples- Influence politique des membres du Conseil National

- Relations entre Etats, organisation

- Réseaux sociaux: famille, connaissances, internet (e-mails, Facebook, Twitter &Co)

• Données- Individuelles: Membre de commissions parlementaires, nombre de conseils

d’administration, parti politique, profession,...

- Relationnelles: Contact, lien avec d’autres personnes (nature, intensité,...)

• Analyse- Carte du réseau (graphe)

- Position dans le réseau (centralité, ...)

- Fréquence et intensité des contacts

- Influence (pouvoir) de la personne

- ...

• Logiciels spécialisés- Ucinet, Pajek,...

MeS

S2

01

5O13

Personnes impliquées dans les attentats du 11 septembre

MeS

S2

01

5O14

Réseau des organisations (transition au Liberia)

MeS

S2

01

5O15Analyse de données qualitatives (textuelles)

• Méthodologies (univers théoriques)- Analyse de discours, herméneutique, phénoménologie, ethnographie, anthropologie,...- Analyse de média- Mixed methods, triangulation

• Documents, “Données”- Textes, discours, entretiens semi-directifs, entretien en profondeur, messages

électroniques, réseaux sociaux (Facebook LinkedIn,...), focus groups, …

- Images (photos, dessins, peintures,...), sons, vidéos, artefacts (archéologiques,...)

• Préparation pour l’analyse- Codage des documents

• Analyse- Analyse de contenu

- Analyse lexicale- Analyse statistique- ...

- Analyses qualitatives

- Analyse conceptuelle (ex. Analyse conversationnelle, grounded theory,...)

• Logiciels spécialisés- Nvivo, Atlas-ti, WordStat, MaxQDA, QDAMiner, LexiQuest, ...

MeS

S2

01

5O16

jhh ddjashdjas hdjash djhdsah dsajhd sdhdjashd d dhj sddajhsd hdjashdsjdhjashd sdjahdsa sd s sd ds adsd asd ewqe wqe ew as d sadasdas ads asdasd as asd das d sad asdasd dasd asd asd asd as ad a das dsa d sd sd as dsa dsasdas dsa dsad asd asd asd asd as das d ads a d asd asd adsad asd s das sd dssd sd sda das ew k kj kj kj kj kj kj kj j nmnb h jh hg gh n bnb n bh zuj jh j hjb n g fr th gfg f gf jhhg hj hj gh h gh ghghhg hg 7 tz t qw qw2q w dasd A SDADSA DS dsa d sad dsA D D C XY DSA DSA SAD DASD D SA DAS D SD S SD S D DS SD SDS SDA DSWDFD SDA DF SADF SDA DSA SDA DAS SDA DAS DWDS SD SD SD W SD S DS D SD W2 DS DAS QASDWQ D SA S DAS D ASD ASD W SD S SD Wqwqwqwqw wq wqfrefsaf fds fdsff dfe edde de erresd ddsdsdsd sdr3 fhjhdfjh fd df dfds sdfsd sfsdf sdsd sdsd sds

Documents à analyser Mots

Coder des segments

Analyse de contenu [content analysis]

Matricede données

Analyse statistique

• Fréquences, co-occurrences• Analyses dimensionnelles• Classification• .....

Mise en relation des codesRéseaux de codes (concepts)

“Theory Building”

Word crunching

• Manuel• Automatique (dictionnaire)

(Corpus)

“Statistique textuelle”

Référence à l’histoire

Justifie

con

séq

uen

ceasso

ciation

Valeurs suisses

Concept-x

Concept-y

MeS

S2

01

5O17

PhraseNo

Phrases UDC SocialismeIntensitéAttaque

NationalSocialisme

1 Dans le point de la situation politique que j'ai fait à l'occasion du 12e con-grès annuel de l'Albisgüetli du 21 janvier 2000 et que j'ai ensuite envoyé àtous les ménages suisses, j'ai textuellement dit ceci:

Non Non 0 Non

2 «A l'heure actuelle, ce sont les socialistes qui remportent la palme en mat-ière de manque de crédibilité: le socialisme, tant applaudi par ceux quinous critiquent, a vécu en 1989 son effondrement économique, politique etmoral complet.

Non Oui 6 Non

3 De nos jours, les socialistes échoués cherchent à détourner l'attention dupublic, en traitant à la légère de fascistes d'autres partis politiques.

Non Oui 0 Non

4 Les socialistes ont-ils donc oublié que la Suisse a défendu entre 1933 et1945 la souveraineté, la neutralité, la démocratie directe et le fédéralismecontre le raz-de-marée brun?

Non Oui 5 Oui

5 L'UDC, qui était à l'époque au premier rang, défend encore aujourd'huices valeurs comme aucun autre parti politique denotre pays.

Oui Non 0 Non

6 C'est précisément la gauche, qui méprise ces valeurs, qui se permet main-tenant de reprocher à l'UDC des idéologies extrémistes.

Oui Oui 3 Non

7 Nos adversaires souhaitent occulter le fait qu'il n'existe pas la moindre dif-férence entre les responsables bruns et rouges des génocides commis ausiècle passé.

Non Oui 8 Oui

8 Ceux, parmi les socialistes, qui traitent à l'heure actuelle si légèrement au-trui de fascistes devraient réaliser que leur adoration de l'état omnipotent,que leur fixation sur la collectivité et leur mépris de la liberté de l'individuse rapprochent nettement plus des idéologies fascistes que notre vision dumonde.

Non Oui 4 Oui

Création d’un tableau de données à partir de segments identifiés (codage)

Discours de C. Blocher

MeS

S2

01

5O18

Dans le point de la situation politique que j'ai fait à l'occasiondu 12e congrès annuel de l'Albisgüetli du 21 janvier 2000 etque j'ai ensuite envoyé à tous les ménages suisses, j'ai tex-tuellement dit ceci:«A l'heure actuelle, ce sont les socialistesqui remportent la palme en matière de manque de crédibilité:le socialisme, tant applaudi par ceux qui nous critiquent, avécu en 1989 son effondrement économique, politique etmoral complet. De nos jours, les socialistes échoués cherch-ent à détourner l'attention du public, en traitant à la légère defascistes d'autres partis politiques. Les socialistes ont-ilsdonc oublié que la Suisse a défendu entre 1933 et 1945 lasouveraineté, la neutralité, la démocratie directe et le fédéral-isme contre le raz-de-marée brun? L'UDC, qui était àl'époque au premier rang, défend encore aujourd'hui ces va-leurs comme aucun autre parti politique denotre pays. C'estprécisément la gauche, qui méprise ces valeurs, qui se permetmaintenant de reprocher à l'UDC des idéologies extrémistes.Nos adversaires souhaitent occulter le fait qu'il n'existe pas lamoindre différence entre les responsables bruns et rouges desgénocides commis au siècle passé. Ceux, parmi les social-istes, qui traitent à l'heure actuelle si légèrement autrui de fas-cistes devraient réaliser que leur adoration de l'étatomnipotent, que leur fixation sur la collectivité et leur méprisde la liberté de l'individu se rapprochent nettement plus desidéologies fascistes que notre vision du monde. Ce n'est paspar hasard que les hordes brunes ont choisi de s'appeler 'na-tional-socialistes‘ [...].[2]

ValeursSuissesSegment de texte 1Coder

Index

Discours de C. Blocher

Segment de texte 2

Socialisme

Adversaire

RéférenceHistorique

Codes, mots-clé, tags

Lien

Coder