60

Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Embed Size (px)

Citation preview

Page 1: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Introduction à STATA

Nathalie Colombier & Julien Licheron

Activité organisée par PROJECT

Jeudi 3 Juillet 2008

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 2: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Pourquoi STATA ?

Logiciel intuitif : interface et fenêtres

Relativement �exible : dispose souvent de nombreuses options,et permet aussi de programmer

Grosse communauté d'utilisateurs : nombreux modulessupplémentaires, aide et documentation sur Internet, travaildes "Stata boys"

Particulièrement adapté aux variables qualitatives

Utilisé dans des disciplines autres que l'économie (�nance,épidémiologie, biologie, . . . )

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 3: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Plan de la Présentation

1 Introduction

2 Fichiers de Stata

3 Traiter les Variables

4 Statistiques Descriptives

5 Variables Qualitatives

6 Séries Temporelles

7 Données de Panel

8 Quelques Extensions

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 4: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA

Stata se présente sous la forme de 4 fenêtres :

Review : a�che l'historique des commandes tapées par l'utilisateuret permet d'en rappeler une facilement.

Results : utilisée pour a�cher tous les résultats des commandestapées par l'utilisateur.

Variables : détaille toutes les variables présentes dans la base dedonnées actuellement ouverte dans Stata (Stata ne peut ouvrirqu'une seule base de données en même temps).

Command : permet à l'utilisateur d'entrer les commandes.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 5: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 6: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA

⇒ Une barre de menus qui permet d'exécuter les commandes les pluscourantes sous Stata sans avoir à se servir de la fenêtre Command.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 7: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA

Deux icônes permettant d'a�cher la base de données (Data Editorou Data Browser) également accessibles par le biais du menu(Data/Data Editor ou Data/Data Browser) et directement à partirde la fenêtre de commandes (edit ou browse).

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 8: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Fichiers et répertoires

Stata utilise plusieurs types de �chiers, nommés d'après leurs extensions :

1 Fichier .do : Fichiers de commandes, lisibles dans n'importe queléditeur de texte et bien entendu par le Do-�le Editor inclu dansStata. Ils permettent à l'utilisateur de lancer plusieurs commandesStata en une seule opération et de garder une trace des commandesexécutées

2 Fichier .smcl : Fichiers d'aide (.hlp, ) ou de log (extension libre, engénéral .log). Ces �chiers s'a�chent dans le Viewer Stata ou dansn'importe quel éditeur de texte. La syntaxe smcl permet à Statad'a�cher le gras, les italiques, etc.

3 Fichier .dta : Fichiers de données au format Stata.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 9: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Do-�le editor

Il est possible de lancer l'intégralité du do-�le ou d'en exécuter seulementune partie.

⇒ Pour cela, il su�t de sélectionner la partie souhaitée du .do avant decliquer sur Do ou Run.

La seule di�érence entre Run et Do est que la seconde commande a�che

les résultats dans la fenêtre Results, alors que la première est silencieuse.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 10: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Do-�le editor

L'ouverture du Do-File Editor peut se faire en appuyant sur l'icônecorrespondante dans la barre de menu, en sélectionnant dans le menuWindows/Do-�le Editor/New �le, ou en entrant doedit dans la fenêtreCommand.

Lorsqu'on utilise Stata, il est préférable d'utiliser un �chier Do-�le.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 11: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Do-�le editor

Un page blanche apparaît, et c'est sur cette page blanche que l'on inscrittoutes les commandes que l'on veut faire exécuter sur nos données. Pourexécuter tout ou une partie des commandes, il su�t d'appuyer sur l'icône setrouvant sur la barre d'outil du �chier Do-�le.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 12: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Do-�le editor

Commandes utiles à insérer en préambule du do-�le :

1 Gestion de la mémoire : Lorsque Stata doit ouvrir une base de données,celle-ci est intégralement chargée en mémoire.

⇒ Pour un état des lieux de la mémoire, memory.

Stata dispose par défaut de 10 mégas de mémoire ⇒ toute base de plusde 10 mégas ne s'ouvrira pas sauf si on modi�e la quantité de mémoiredisponible pour Stata.

Pour véri�er la taille de la base à charger, on utilise la commandedescribe using mabase.dta.

Si celle-ci nécessite 100 mégas, set memory 100m⇔ set mem 100m.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 13: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Do-�le editor

2 Log : Pour conserver une trace complète de tout ce qui s'a�che dans lafenêtre Results au cours d'une session (commandes/résultats...), il estpossible (et préférable!) de créer un �chier log.

Stata permet de créer des log au format texte (option text), ou au formatsmcl (option smcl). Ce dernier format permet un a�chage du log dans leViewer Stata très propre, mais complique la lecture du log avec d'autreslogiciels.

Pour commencer un nouveau �chier de log :log using mon�chierou bienlog using �D:\Home\ncolombi\MESDOCUMENTS\document\économétrie\essai.smcl�,text.Pour le fermer log : log close.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 14: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA

Pour mettre le log à la suite du log issu de la précédente session Stata :append.

Pour débuter à partir d'un �chier vierge : replace.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 15: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Do-�le editor

3 Gestion de l'a�chage :

Pour supprimer l'a�chage des résultats d'une commande,quietly commande.

Pour détailler au maximum les opérations réalisées par Stata :set trace on.

Pour que Stata ne stoppe pas au cours de l'exécution d'undo-�le lorsque l'a�chage des résultats atteint le bas de lafenêtre Results, set more o�.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 16: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Présentation STATA : Do-�le editor

EN RÉSUMÉ

On débute le programme avec la commande clear a�n de vider lamémoire de Stata.

On spéci�e la taille de la mémoire à allouer set memory 100m⇔ setmem 100m.

on indique quelle base utiliser use�D:\document\économétrie\EPCV\indo05.dta� .il est conseillé d'ouvrir un �chier log : log using nouveaunom.log,replace(par défaut à la racine) ou bien spéci�er l'emplacement du log :log using �D:\Home\ncolombi\MESDOCUMENTS\document\économétrie\essai.smcl�

commencer le programme par set more o�

il est possible d'inclure des commentaires dans le programme en lesencadrant par des �*�

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 17: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Description des données

Les variables sous Stata peuvent être numériques ou alphanumériques.

Les variables numériques peuvent être de di�érents types, selon laprécision (et la place en mémoire) nécessaire.

Les variables alphanumériques (en rouge dans browser) sont des chaînesde caractères quelconques (string, str), d'une longueur maximale de 244caractères. Pour transformer une chaîne en variable numérique, destringvariable, options. Parmi les options, gen(var) ou replace.

Stata stocke par défaut une variable sous forme de chaîne lorsque lavariable contient au moins un caractère non-numérique (souvent variablesmanquantes)

⇒ Il est impossible d'utiliser cette variable dans une régression. Pourcontraindre Stata à ignorer les caractères non numériques, l'option force.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 18: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Généralités

Lors de l'écriture de programmes :

Pour chaque nouvelle commande il faut passer à la ligne, il estinutile de �nir par �,� ou �;�. Par contre, à chaque commandesont associées des options et la structure est :nom_de_commande variables_concernées, options

Stata ne tient pas compte des espaces multiples

Minuscules/majuscules : les commandes sont à taper enminuscules, attention aux noms de variables comportant desmajuscules.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 19: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Opérateurs et fonctions mathématiques

Quelques remarques :

En ce qui concerne le signe =, il existe une particularité. Lorsque lesigne = est une conjecture (à tester) ou une condition et non unedé�nition, on doit le remplacer par ==.

Les valeurs manquantes (symbolisées par un point �.� sous Stata)sont les plus grandes valeurs. Ainsi, l'expression salaire> 1500 estvraie si le salaire est supérieur strictement à 1500 ou manquant.Pour ne conserver que les valeurs supérieures à 1500 et nonmanquantes, il faut préciser : salaire>1500 & salaire<.

Les opérateurs suivent l'ordre de priorité habituel. L'opérateur �Et�est prioritaire sur l'opérateur �Ou�.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 20: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Opérateurs et fonctions mathématiques

Addition + Soustraction −Multiplication ∗ Division /Egalité = Inégalité ∼= ou ! =Exposant ̂ partie entière int()Racine sqrt() Exponentielle exp()Logarithme log() Valeur absolue abs()Sup. (resp. Inf.) > (resp. <) Sup. (resp. Inf) ou égal >= (resp. <=)Ou | Et &Minimum min() Maximum max()

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 21: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Trois expressions : by, if et in

Ces trois expressions peuvent s'utiliser avec la majorité des commandesStata. On peut les combiner les unes avec les autres.

1 by permet d'appliquer une commande à chaque valeur d'unevariable. La syntaxe de cette expression est by variable :commande variable.

En amont, il faut que la base de données soit classée par cettevariable. On peut utiliser sort avant by, ou pour classer et e�ectuerle by en même temps, bysort.

Exemple : bysort sexe : summarize salaire permet d'obtenir lesalaire moyen des femmes et des hommes.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 22: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Trois expressions : by, if et in

2 if permet de n'appliquer la commande qu'aux observationsremplissant une condition particulière.

Syntaxe : commande variable if condition.

Exemple : summarize salaire if age==18 | age>20 &age<=50 donne les statistiques descriptives de la variable salairepour les observations dont la variable age est égale à 18 ou compriseentre 20 (exclu) et 50 (inclus).

L'opérateur & est prioritaire, les parenthèses sont inutiles ici.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 23: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Trois expressions : by, if et in

3 in permet de n'appliquer la commande qu'aux observations sesituant dans un intervalle donné.

Syntaxe : commande variable in condition.

Exemple : summarize salaire in 10/20 donne les statistiquesdescriptives de la variable salaire pour les observations de la 10èmeà la 20ème ligne de la base de données.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 24: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Décrire et manipuler des données

describe : a�che la liste de toutes les variables, le type et leséventuels labels (peu utilisé) ⇔ des.

ds : liste les variables

codebook variable : détaille la variable ie. modalités possibles,fréquences, nombre de données manquantes, . . .

rename ancien_nom nouv_nom : Renomme la variableancien_nom en nouv_nom.

replace x = 12 : Remplace le contenu de la variable x par 12 (xdevient une constante).

replace x = y if y > 10 & y ∼= . : Remplace la valeur de x parcelle de y , si y est supérieur à 10 et contient une valeur.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 25: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Décrire et manipuler des données

drop x : Supprime la variable x .

drop _all : Supprime toutes les variables

keep x : Conserve la variable x, supprime toutes les autres.

label var variable �label� : Attribue à une variable x un label (uneétiquette).

Exemple : label var lnsal "logarithme du salaire brut".

global liste �var1 var2 var3 . . . varn� : permet de générer uneliste de variables appellée 'liste'.

regress salaire $liste ⇔ regress salaire var1 var2 var3 . . . varn

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 26: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Décrire et manipuler des données

Dans le cadre notamment de l'économétrie des variables qualitatives, lecodage est déterminant et il est souvent nécessaire de générer oumodi�er des variables.

Créer des variables : deux commandes existent :

generate permet de créer des variables qui nécessitent des calculs�simples�

egenerate (extended generate) s'impose lorsque les calculs secomplexi�ent un peu ou que l'utilisation de fonctions statistiquesspéci�ques est nécessaire.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 27: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Décrire et manipuler des données

Exemples d'utilisation de generate :

gen x = 12 : crée une constante nommée x, qui vaut 12.

gen x = log(a*b)-sqrt(abs(b)): La nouvelle variablex = log(a× b)−

√|b| .

gen x = (sexe==�Homme�): x est égal à 1 si la variable sexecontient la chaîne de caractère �Homme�, 0 sinon.

gen x = y[_n-1] : x est égale à la valeur de l'observationprécédente de y.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 28: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Décrire et manipuler des données

Exemples d'utilisation de egenerate :

egen x = sd[y] : x, constante, est égal à l'écart-type de y.

egen x = pctile(y), p(50) : x est égal à la médiane de y.

Replace : permet de recoder, de remplacer certaines valeurs d'unevariable par d'autres valeurs :

replace satis=1 if satis==2|satis==3 : remplace satis par lavaleur 1 si satis est égale à 2 ou 3.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 29: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Fusionner des bases de données

Stata ne peut ouvrir qu'une seule base de données en même temps. Pourtravailler simultanément sur deux bases de données : soit ouvrir base 1,l'enregistrer puis ouvrir base 2 ; soit ouvrir deux sessions Stata enparallèle.

⇒ Pour fusionner deux bases de données, deux cas sont à distinguerselon que l'on souhaite ajouter des observations ou bien des variables :

1 Ajouter de nouvelles observations :

append using nom_de_la_base2

Il faut bien entendu que les variables aient rigoureusement le mêmenom dans les deux bases de données.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 30: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Fusionner des bases de données

2 Ajouter de nouvelles variables : il est impératif que les données soientordonnées de la même facon dans les deux bases (sortnom_de_variable(s)). Base 1 ouverte.

merge nom_de_variable(s) using nom_de_base2,optionsUne nouvelle variable _merge est créée et indique le résultatde la fusion. Les options les plus usitées : unique (conserveobservations non fusionnées base 1 et 2), uniqmaster(conserve observations non fusionnées base 1) et uniqusing(conserve observations non fusionnées base 2).

joinby nom_de_variable(s) using nom_de_base2,options : la di�érence avec merge est que joinby ne conserveque les observations pour lesquelles il y a eu fusion.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 31: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Statistiques Descriptives

summarize variable (sum) permet d'obtenir les statistiquesdescriptives usuelles. L'option detail permet d'en avoir plus.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 32: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Statistiques Descriptives

tabulate variable (tab) calcule les fréquences des valeurs prises parune variable, et permet de créer des tableaux croisés pour deuxvariables.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 33: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Statistiques Descriptives

tabulate variable, row col cel (tab) permet de créer des tableauxcroisés pour deux variables avec toutes les fréquencesconditionnelles associées.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 34: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Statistiques Descriptives

count if condition renvoies le nombre d'observations quiremplissent la condition imposée. Peut être associée à by.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 35: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Statistiques Descriptives : corrélation et covariance

pwcorr variable1 variable2 donne la matrice de corrélations entreles variables. L'option sig permet d'obtenir le résultat du test denullité du coe�cient de corrélation.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 36: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Statistiques Descriptives : corrélation et covariance

corr variable1 variable2, cov permet d'obtenir la matrice desvariance-covariances.

pwcorr variable1 variable2 variable3 permet d'obtenir lescoe�cients de corrélation partielle entre les variables prises deux àdeux.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 37: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Tests sur la moyenne, la variance et la distribution des

variables

ttest permet de comparer les moyennes de deux variables.

Attention : ce test repose sur l'hypothèse implicite d'égalité desvariances des deux variables. L'option unequal permet de relâchercelle-ci.

Exemples :

ttest age, by(homme), pour tester la signi�cativité de la di�érenced'âge entre hommes et femmes.

ttest age=40 : pour savoir si l'âge moyen est égal à 40 ans.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 38: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Tests sur la moyenne, la variance et la distribution des

variables

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 39: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Variables qualitatives : modèle binaire

On peut utiliser le modèle logit ou probit.

Les commandes sont du type :

logit variable_expliquée variable_explicatives.

probit variable_expliquée variable_explicatives.

Par exemple :

probit horlib homme age cspinter cspintel cycle1 cycle23useintbu joigndepb

logit horlib homme age cspinter cspintel cycle1 cycle23useintbu joigndepb

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 40: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Variables qualitatives : modèle binaire

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 41: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Variables qualitatives : modèle binaire post estimation

1 Pour obtenir les e�ets marginaux :

après l'estimation d'un modèle Logit ou Probit⇒ on utilise la commande mfx compute.

dans le cadre du modèle Probit, la commande dprobit calculedirectement les e�ets marginaux, sans passer par lescoe�cients.

2 predict p permet d'obtenir la probabilité prédite notée p.

3 lstat permet d'obtenir le taux de bonnes et mauvaises prédictions.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 42: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Variables qualitatives : e�ets marginaux

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 43: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Variables qualitatives : probabilités prédites

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 44: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Variables qualitatives : modèle multinomiaux

Modèles ordonnés : la syntaxe est similaire à celle utilisée pour lesmodèles binaires avec les commandes oprobit pour le probitordonné et ologit pour le logit ordonné.

Modèles multinomiaux :

Stata gère assez mal les modèles de type Probit multivariéscomportant plus de 4 alternatives.Les modèles de type Logit multinomiaux par contre s'estimentsans problème avec la commande mlogit.mlogit statut homme diplome age, baseoutcome(1)

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 45: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Quelques tests . . .

Hausman :

mlogit statut homme diplome age, baseoutcome(1)

est store modele1

mlogit statut homme diplome age if statut !=0,baseoutcome(1)

est store modele2

hausman modele1 modele2, alleqs constant

Heckman :

heckman : régression avec probit de sélectionheckman wage educ age, select(married children educage),optionsheckprob : probit avec probit de sélectionheckman job educ age, select(married children educage),options

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 46: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Utilisation des séries temporelles

Pour spéci�er la nature temporelle des données, il faut utiliserla commande : tsset variable_temporelle [, options]Par exemple tsset month, monthly

ts�ll : remplace les "trous" par des valeurs manquantes

tsreport : reporte des stats sur la structure des sériestemporelles (trous, observations multiples, . . . )

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 47: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Principaux opérateurs de séries temporelles

L. : opérateur retard (xt−1)

L2. : deuxième retard (xt−2)

F. : opérateur lead (xt+1)

F2. : deuxième lead (xt+2)

D. : opérateur di�érence (xt − xt−1)

D2. : opérateur di�érence (xt − xt−1)−(xt−1 − xt−2)

S. : opérateur di�érence saisonnière (xt − xt−1)

S2. : opérateur di�érence saisonnière (xt − xt−2)

Sn. : opérateur di�érence saisonnière (xt − xt−n)

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 48: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

↪→ Ces opérateurs peuvent être utilisé directement dans lescommandes, par exemple :

sum L.gdp

regress y x1 L.x1 L4.x2

↪→ Ces opérateurs peuvent être combinés, par exemple :

L(1/4).gdp : équivalent à L.gdp L2.gdp L3.gdp L4.gdp

F(2/3).inf : équivalent à F2.inf F3.inf

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 49: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Quelques modèles disponibles

Modèles de régression simples (MCO, MCG)Exemple : regress y x1 x2, noconstant

Modèles AR(p), MA(q) ou ARMA(p,q)Exemple : arima y x1 x2, ar(2) ma(1/4)

Modèle ARIMA(p,d,q)Exemple : arima y x1 x2, arima(2,2,1/4)

Modèles ARCH, GARCH et dérivés

Modèles VAR, SVAR et VECM

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 50: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Modèles à variables instrumentales (TSLS) - STATA 9Exemple : ivreg y x1 (x2 = inst1 inst2), robust

Modèles GMM - STATA 9Exemple : ivreg2 y x1 (x2 = inst1 inst2), gmm robust

↪→ Dans STATA 10, une seule commande : ivregress

ivregress 2sls y x1 (x2 = inst1 inst2), vce(robust)

ivregress gmm y x1 (x2 = inst1 inst2), vce(robust)

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 51: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Quelques tests pour séries temporelles

Tests de racine unitaire ou de stationnarité

Test de Dickey-Fuller et tests ADF :dfuller variable, lags(n) noconstant trend

Test de Phillips-Perron :pperron variable, lags(n) noconstant trend

Test KPSS : kpss variable, lags(n) notrend

Tests d'autocorrélation des erreurs (après une régression)

Test de Durbin-Watson : estat dwatson

Test de Breusch-Godfrey : estat bgodfrey, lags(n)

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 52: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Utilisation des données de panel

Pour dé�nir la nature de panel des données, il faut utiliser lacommande :tsset var_individu var_temporelle [, options]Par exemple : tsset id quarter, quarterly

xtsum : permet d'obtenir des stats descriptives intra- etinter-individuelles (Version panel de sum)

xttab : calcule les fréquences intra- et inter-individuelles(Version panel de tab)

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 53: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Quelques modèles pour données de panel

Modèle à e�ets �xesExemple : xtreg y x1 x2, fe

Modèle à e�ets aléatoiresExemple : xtreg y x1 x2, re

Modèle avec variables instrumentalesExemple : xtivreg y x1 (x2 = inst1 inst2), fe

Modèle GMM en panelExemple : xtivreg2 y x1 (x2 = inst1 inst2), fe gmm

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 54: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Modèles de panel dynamique estimés par GMM : commandextabond2

Estimateur de Arellano & Bond (1991) - di�erence-GMM

Exemple : xtabond2 y L.y x1 x2, robust small noleveleqgmmstyle(L.y x1) ivstyle(x2)

Estimateur de Blundell & Bond (1998) - system-GMM

Exemple : xtabond2 y L.y x1 x2, robust smallgmmstyle(L.y x1, lags(2 .) collapse)ivstyle(x2, lags(1 .) collapse)

↪→ Plus d'infos sur cette commande :Roodman D. (2006): "How to do xtabond2: An introduction todi�erence and system GMM in Stata", Center for GlobalDevelopment, Working Paper 103, Washington.

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 55: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Variables qualitatives en panel

Probit à e�ets aléatoiresExemple : xtprobit y x1 x2, re

Logit à e�ets �xesExemple : xtlogit y x1 x2, fe

Probit ordonné à e�ets aléatoiresExemple : reoprobit y x1 x2

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 56: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Quelques tests pour données de panel

Tests de racine unitaire ou de stationnarité

Test de Levin, Lin & Chu (LLC) :levinlin variable, lags(n) noconstant trend

Test de Im, Pesaran & Shin (IPS) :ipshin variable, lags(n) trend nodemean

Test d'Hadri : hadrilm variable, lags(n) notrend

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 57: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Meta-analyse avec STATA

Pas de commande unique pour la meta-analyse, mais une suitecomplète de modules développés par les utilisateurs

meta et metan : stats et forest plot

metareg : régression

metafunnel et metabias : funnel plot et tests d'asymétrie

metatrim : "trim and �ll" method

metainf : tests de sensibilité

. . .

↪→ Plus d'infos sur ces commandes :http://www.stata.com/support/faqs/stat/meta.html

http://www.blackwellpublishing.com/medicine/bmj/

systreviews/pdfs/chapter18.pdf

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 58: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Exportation des tableaux de résultats

Exportation en �chier ASCII (.out) ou Word (.doc) :commande outreg

regress y x1 x2outreg using table1.out, title("Table 1") ctitle("A")regress y x1 x2 x3outreg using table1.out, append ctitle("B")type table1.out

Exportation au format LATEX(.tex) : commande est2tex↪→ Plus d'infos dans le guide de F. Bresson :http://129.3.20.41/eps/prog/papers/0506/0506001.pdf

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 59: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Ajout de nouvelles commandes

Pour installer de nouveaux modules à Stata (�chiers .ado et .hlp) :ssc install nom_du_module, all

Par exemple :

ssc install xtabond2, all

ssc install levinlin, all

Pour voir les nouveaux modules disponibles pour Stata (environ 50modules depuis janvier 2008 !):http://ideas.repec.org/s/boc/bocode.html

Nathalie Colombier & Julien Licheron Introduction à STATA

Page 60: Introduction à STATA - abenkhalifa.files.wordpress.com · Results : utilisée pour a cher tous les résultats des commandes tapées par l'utilisateur. Variables : détaille toutes

Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions

Trouver de l'aide. . .

Aide interne à Stata : help command

Manuels o�ciels Stata : complètent l'aide en ligne et donnentdes exemples

Site(s) Web de Stata et du Stata Journal :http://www.stata.com

http://www.stata-press.com

http://www.stata-journal.com

. . . et également la Statalist !http://www.stata.com/statalist

Nathalie Colombier & Julien Licheron Introduction à STATA