L'offre de travail des chauffeurs de taxi: Un duel de modèles€¦ · Bernard Fortin, codirecteur de recherche. ... iii. Table des matières Résumé iii ableT des matières iv Liste

L’offre de travail des chauffeurs de taxiUn duel de modèles

Mémoire

Hugo Leblond

Maîtrise en économieMaître ès arts (M.A.)

Québec, Canada

© Hugo Leblond, 2017

L’offre de travail des chauffeurs de taxiUn duel de modèles

Mémoire

Hugo Leblond

Sous la direction de:

Vincent Boucher, directeur de rechercheBernard Fortin, codirecteur de recherche

Résumé

L'objectif de ce mémoire est d'identi�er le modèle de comportement qui illustre le mieux le

processus décisionnel du travailleur. Plus particulièrement, j'y oppose le modèle intertemporel

au modèle d'atteinte d'objectif (ou modèle reference-dependent). Pour ce faire, j'utilise des

données portant sur l'ensemble des courses e�ectuées par les chau�eurs de taxi new-yorkais

pour l'année 2013. A�n de simuler des variations de salaire, j'utilise les conditions météorolo-

giques.

J'observe d'abord, à l'aide de plusieurs régressions par Moindres Carrés Ordinaires, les réac-

tions du marché lors d'une période de mauvais temps. À la fois l'o�re et la demande semblent

augmenter. Je tente ensuite, à l'aide d'un modèle de mélange gaussien, de déterminer s'il y a

de l'hétérogénéité dans le comportement des chau�eurs. Je trouve un possible e�et de spécia-

lisation. Je continue mon analyse par l'estimation d'élasticités en régressant le log du nombre

d'heures travaillées sur le log du salaire. Je me prémunis du problème d'endogénéité du sa-

laire en utilisant l'estimateur par Moindre Carrés en Deux Étapes, avec comme instruments le

niveau de précipitation moyen et la vitesse moyenne du vent lors du quart de travail. Les élas-

ticités obtenues se situent entre 0,43 et 0,57. Je termine avec l'estimation d'un modèle probit

sur la probabilité d'arrêter de travailler, avec comme facteurs principaux le nombre d'heures

e�ectuées et le montant d'argent accumulé. L'e�et rapporté pour le montant accumulé est

négatif.

Dans l'ensemble, les résultats sont en accord avec le modèle intertemporel.

iii

Table des matières

Résumé iii

Table des matières iv

Liste des tableaux v

Liste des �gures vii

Remerciements ix

Introduction 1

1 Revue de littérature 31.1 Mise en contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Les tenants du modèle reference-dependent . . . . . . . . . . . . . . . . . . . 41.3 Les partisans du modèle intertemporel . . . . . . . . . . . . . . . . . . . . . 6

2 Les modèles en opposition 82.1 Le modèle intertemporel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2 Le modèle reference-dependent . . . . . . . . . . . . . . . . . . . . . . . . . 122.3 Distinction des modèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3 Les données 163.1 Source et manipulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2 Pourquoi l'industrie du taxi ? . . . . . . . . . . . . . . . . . . . . . . . . . . 193.3 Sur l'utilisation de grandes bases de données . . . . . . . . . . . . . . . . . . 20

4 Méthodologie et résultats 214.1 Véri�cation d'hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.2 Les réactions du marché face à la pluie . . . . . . . . . . . . . . . . . . . . . 234.3 Estimation d'élasticités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334.4 Modèle de choix discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Conclusion 44

Bibliographie 45

iv

Liste des tableaux

3.1 Description des données sous forme par course . . . . . . . . . . . . . . . . . . . 183.2 Distribution des courses selon le temps . . . . . . . . . . . . . . . . . . . . . . . 183.3 Description des données sous forme par quart . . . . . . . . . . . . . . . . . . . 19

4.1 Réactions du marché des taxis au mauvais temps. Régressions par MCO (sanscontrôles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

4.2 Réactions du marché des taxis au mauvais temps. Régressions par MCO (aveccontrôles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.3 Résultats d'un FMM à deux composantes d'une régression du nombre de courses/heuresur le mauvais temps. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.4 Résultats d'un FMM à deux composantes d'une régression du nombre d'heurestravaillées sur le mauvais temps . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4.5 Résultats d'un FMM à deux composantes d'une régression de la distance/heuresur le mauvais temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.6 Résultats de la première étape des régressions par MC2E . . . . . . . . . . . . . 364.7 Élasticitées estimées par MC2E . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.8 E�ets marginaux moyen d'une estimation probit, par mois, de la probabilité

d'arrêter de travailler à la �n d'une course . . . . . . . . . . . . . . . . . . . . . 43.9 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois de janvier . . . . . . . . . . . . . . 51.10 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois de février . . . . . . . . . . . . . . . 52.11 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois de mars . . . . . . . . . . . . . . . . 53.12 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois d'avril . . . . . . . . . . . . . . . . 54.13 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois de mai . . . . . . . . . . . . . . . . 55.14 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois de juin . . . . . . . . . . . . . . . . 56.15 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois de juillet . . . . . . . . . . . . . . . 57.16 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois d'août . . . . . . . . . . . . . . . . 58.17 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la �n d'une course pour le mois de septembre . . . . . . . . . . . . . 59

v

.18 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de octobre . . . . . . . . . . . . . . 60

.19 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de novembre . . . . . . . . . . . . . 61

.20 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de décembre . . . . . . . . . . . . . 62

vi

Liste des �gures

2.1 Fonction d'utilité et courbre d'indiférence reference-dependent linéarisé. . . . . 13

vii

À ma petite soeur Audrey qui,

comme un taxi, ne reste jamais

longtemps en place.

viii

Remerciements

En premier lieu, je tiens à remercier chaleureusement mes directeurs, MM. Vincent Boucher

et Bernard Fortin, sans qui ce mémoire ne serait qu'une pâle copie de lui-même. Vincent, par

sa grande générosité, sa disponibilité, son enthousiasme (et bien d'autres raisons), a fortement

contribué à faire de ma maitrise une expérience heureuse.

Je désire également souligner mon immense gratitude pour le Centre de recherche sur les

risques, les enjeux économiques et les politiques publiques (CRREP), qui par son �nancement

aura permis bien plus que la simple complétion d'un travail universitaire.

Le corps professoral du département, pour la qualité d'enseignement, la passion et le dé-

vouement dont j'ai été témoin depuis le tout début de ma formation au baccalauréat, mérite

également le témoignage de ma reconnaissance.

Je ne peux oublier mes parents, Mario et Francine, à qui je dois tout. Merci ! Je ne le démontre

pas souvent, mais sachez que je vous aime. Avec votre soutien, j'ai encore une fois � battu

Bowser �.

En�n, impossible d'oublier ma copine Marie-Êve, qui mérite bien plus que des remerciements

pour ses sacri�ces et sa patience lors des deux dernières années. À toi, je dirai simplement ceci

... � Ta*****k ! Merci hein ! �.

Je m'arrête ici, bien que je pourrais continuer ainsi et faire de ces remerciements un chapitre

complet, tant il y a de personnes envers lesquelles je suis reconnaissant . . .

ix

Introduction

Parmi les modèles les plus étudiés en économie du travail se trouve le modèle néoclassique

intertemporel (ou modèle du cycle de vie). Au nombre des prédictions de ce modèle, on re-

trouve que le travailleur cherche à augmenter le nombre d'heures o�ertes lorsqu'il observe une

augmentation temporaire de son salaire (en absence d'e�et de richesse).

Bien que cette prédiction semble évidente, Camerer, Babcock, Lowenstein et Thaler (1997), en

analysant le comportement des chau�eurs de taxi new-yorkais, identi�ent plutôt une relation

négative entre variation temporaire du salaire et heures de travail. Ceux-ci travailleraient donc

longtemps lorsque les salaires sont faibles et peu lorsqu'ils sont élevés.

Dans le but de trouver une explication à cette curiosité, les auteurs suggèrent l'utilisation

d'un modèle qui tire son origine de la théorie d'aversion à la perte, développée entre autres

dans les articles de Kahneman et Tversky (1979) et Tversky et Kahneman (1991). Dans ce

modèle, on suppose que l'individu a des préférences qui dépendent d'un point de référence

(ici en termes de revenu). On suppose de plus que l'agent est plus sensible aux variations de

revenu qui le mènent en desous de ce point de référence qu'aux variations le menant au-dessus.

La conséquence directe de ces deux hypothèses est qu'il se crée une cassure autour du point

de référence, qui mène à cette relation négative.

Plusieurs études ont depuis tenté d'opposer ces deux modèles et ce dans divers contextes.

Certains donnent raison au modèle intertemporel. C'est le cas, entre autres, de Oettinger

(1999) pour des données portant sur les vendeurs de hot-dog dans les stades de baseball

américains. Fehr et Gotte (2007), qui utilisent des données sur les courriers à vélo allemands,

estiment eux aussi des élasticités positives. Ces derniers observent cependant une diminution

de l'e�ort fourni chez certains travailleurs, ce qui les incitent à croire en la pertinence du

modèle alternatif. En utilisant des données fournies par une �rme d'empaquetage de poires,

Chang et Grass (2013) argumentent en faveur du modèle avec point de référence.

L'objectif de mon mémoire sera donc d'identi�er lequel de ces deux modèles est le plus adé-

quat pour expliquer mes données. Celles-ci portent sur l'industrie du taxi new-yorkais et com-

prennent la totalité des courses e�ectuées au courant de l'année 2013. À l'instar des études qui

m'ont précédé, la méthode utilisée pour départager le modèle vainqueur de ce duel se résume

1

principalement à l'estimation de quelques élasticités par moindres carrés ordinaires et par va-

riables instrumentales, ainsi que d'un modèle probit sur la décision d'arrêter de travailler suite

à l'accomplissement d'une course.

La pertinence de cet exercice s'inscrit d'abord dans un contexte académique. De plus, dans

la mesure où le processus de mise en place et d'évaluation des politiques �scales est basé sur

l'idée de posséder des prédictions solides, on peut trouver un intérêt provenant des instances

gouvernementales. Si, comme le prétendent Camerer, Babcock, Lowenstein et Thaler (1997),

l'o�re de travail d'un individu est déterminée selon un modèle di�érent du modèle intertem-

porel, l'utilisation des estimés habituels pourrait poser problème. Il peut également y avoir

un intérêt provenant du côté entrepreneurial. Une bonne compréhension de la façon dont ré-

agissent les travailleurs suite à une variation de leur salaire peut avoir un impact important

quant à la structure d'incitatifs qu'une entreprise doit mettre en place.

L'apport principal de ce travail à la littérature se fait avant tout par de nouvelles estima-

tions d'élasticités. De plus, l'utilisation de données d'une aussi grande ampleur est peu com-

mune. En�n, l'utilisation d'un modèle de mélange gaussien (Finite Mixture Model) dans le

but d'explorer l'hétérogénéité du comportement chez les chau�eurs est, à ma connaissance,

une première.

Le reste de mon mémoire est présenté comme suit. Dans le premier chapitre, j'expose une

revue de littérature, composée des principaux articles qui analysent le contexte des chau�eurs

de taxi. Dans le second chapitre, j'explique de façon plus exhaustive les deux modèles qui

sont mis en opposition. À travers le troisième chapitre, je discute des données utilisées, de

leur pertinence et souligne quelques di�cultés associées à leur utilisation. Tout au long du

quatrième chapitre, je fais l'exposé des méthodes retenues pour mener à bien mon analyse et

je rapporte les résultats obtenus.

2

Chapitre 1

Revue de littérature

Dans ce chapitre, je présente le contexte duquel est née la littérature sur mon sujet. Je résume

ensuite les principales études qui font l'analyse du comportement d'o�re de travail et qui

utilisent des données sur les chau�eurs de taxi. Je distingue celles-ci selon le modèle que

favorisent leurs conclusions, tout en essayant de conserver un ordre chronologique.

1.1 Mise en contexte

Dans Tversky et Kahneman (1991), les auteurs font suite à leurs travaux sur les choix en

situation d'incertitude et développent le type de modèle reference-dependent 1. À travers cet

article, ils argumentent que le modèle classique de prise de décision par maximisation d'uti-

lité ne re�ète pas correctement la réalité. Plus précisément, le modèle généralement présenté

fait l'hypothèse que l'utilité est continûment di�érentiable. Cette hypothèse est démentie par

les auteurs, qui suggèrent au contraire la présence possible d'une discontinuité dans l'utilité

marginale. Ainsi selon eux, le taux auquel l'individu est prêt à échanger un bien est di�érent

selon qu'il s'agisse pour lui de faire l'acquisition ou de subir une perte dudit bien. Les auteurs

démontrent le bien-fondé de leur hypothèse en relatant une variété de constats expérimentaux.

Entre autres exemples, les auteurs rapportent une expérience menée à plusieurs reprises par

Kahneman, Knetsch et Thaler (1990).

Dans cette expérience, une tasse est distribuée aléatoirement au tiers des étudiants d'une

classe. Chaque participant reçoit ensuite un questionnaire. Au tiers possédant une tasse (les

� vendeurs �), il est demandé d'indiquer, pour plusieurs prix allant de 0,50$ à 9,50$, s'ils sont

prêts à vendre la tasse ou non. De façon similaire, certains autres étudiants (les � choisisseurs �)

devaient indiquer, pour les mêmes prix, leurs préférences entre une tasse et la somme d'argent.

À travers cette expérience, les deux groupes sont placés dans la même situation, à la di�érence

près de leur dotation initiale. Tous doivent choisir entre une tasse ou une somme d'argent. Du

1. Kahneman et Tversky (1979, 1984).

3

point de vue des choisisseurs, puisqu'ils ne possèdent rien, les deux options sont perçues comme

des gains. Les vendeurs quant à eux perçoivent l'échange (en partie) comme la perte de leur

dotation. Comme les deux situations re�ètent un choix identique, on s'attendrait à voir des

réponses similaires pour les deux groupes. Toutefois, les réponses aux questionnaires indiquent

que la valeur médiane attribuée à la tasse était de près de 7,00$ pour les vendeurs et près de

3,50$ pour les choisisseurs. Les auteurs expliquent cette di�érence par ce qu'ils appellent un

e�et de dotation (endowment e�ect). Cet e�et peut se résumer ainsi : le fait de posséder un

objet (qui possède une valeur d'usage autre que l'échange) entraine une sorte d'attachement

émotionnel, qui contribuerait à la douleur associée à l'action de s'en départir.

A�n d'apporter une explication à l'ensemble des constats qu'ils présentent, Tversky et Kah-

neman proposent une alternative au modèle classique de prise de décision. Dans ce nouveau

modèle, quali�é de reference-dependent, le preneur de décision est considéré comme étant

averse à la perte.

1.2 Les tenants du modèle reference-dependent

1.2.1 Camerer, Babcock, Loewenstein et Thaler (1997)

Dans le contexte du travailleur qui doit déterminer ses heures de travail et de loisir, le modèle

intertemporel ne semble pas avoir toujours vu ses prédictions être confortées. L'une de ces

prédictions est que suite à une variation de salaire temporaire n'a�ectant pas l'utilité marginale

de la richesse du travailleur, celui-ci travaillera davantage.

Dans certaines études cependant, qu'elles aient été menées sur une base de données agrégée,

de cohorte ou en panel, les estimations d'élasticités salaire de l'o�re de travail étaient faibles

et non signi�catives ou encore négatives. C'est du moins ce que rapportent Camerer, Babcock,

Loewenstein et Thaler (1997). Les études susmentionnées analysent cependant des contextes où

les variations de salaire sont rarement réellement temporaires, ce qui nécessite des hypothèses

supplémentaires. Au �nal, comme le soulignent les auteurs, les résultats déconcertants obtenus

par celles-ci peuvent être attribuables à des erreurs de spéci�cation.

Dans le but de tester le comportement d'o�re de travail suite à une variation transitoire

du salaire, les auteurs proposent l'utilisation d'un contexte où les salaires sont relativement

constants à travers une journée et non corrélés d'un jour à l'autre. Il leur sera ainsi possible

d'éviter les pièges rencontrés par leurs prédécesseurs. Dans un tel contexte, une augmenta-

tion de salaire, puisqu'elle est temporaire, n'a qu'un impact négligeable sur la richesse du

travailleur. Suivant cette proposition, les auteurs retiennent des données sur les chau�eurs de

taxi new-yorkais pour leur analyse. Pour ces travailleurs, les salaires dépendent en partie de

chocs temporaires sur la demande, causés par exemple par la température, les conventions, un

dysfonctionnement des autres types de transports en commun... Pour trois bases de données

4

di�érentes, les élasticités salaire de l'o�re estimées sont pratiquement toutes négatives, à la fois

par la méthode des moindres carrés ordinaires (-0.186 à -0.618) et par celle de variable instru-

mentale (0.005 à -1.313). Ainsi, les auteurs obtiennent peu de con�rmation que les chau�eurs

suivent le modèle de comportement néoclassique. Entre autres explications, ils soulignent la

possibilité d'un modèle de comportement avec des préférences de type reference-dependent, où

le travailleur se �xe un objectif de revenu à atteindre.

1.2.2 Chou (2002)

Chou (2002) reprend la conclusion de Camerer et coll. (1997) et tente d'opposer directement les

deux types de modèle en utilisant des données portant sur les chau�eurs de taxi singapouriens.

Les données ont été récoltées par un sondage que l'auteur à lui-même créé. En procédant

ainsi, il évite les problèmes généralement rencontrés dans la littérature. De plus, il lui est

ainsi possible d'obtenir de l'information qui n'est pas directement disponible pour les autres

auteurs, tel que l'expérience du travailleur, l'âge, l'éducation, la taille de la famille... Son

sondage lui permet également d'aborder la question de manière directe auprès des chau�eurs,

en leur posant des questions sur leur comportement de travail lors d'une journée payante.

Comme dans le cas de Camerer et coll. (1997), les résultats obtenus par Chou (2002) pointent

vers le modèle reference-dependent. Que ce soit par MCO (-0.0997 à -0.5850) ou en utilisant

des méthodes de variable instrumentale (-0.1644 à -0.8939), les élasticités estimées sont toutes

négatives. Il démontre également que les chau�eurs ayant déclaré travailler davantage lors de

journées à salaire élevé a�chent des élasticités encore plus négatives que ceux ayant a�rmé

travailler le nombre d'heures habituel.

1.2.3 Crawford et Meng (2011)

L'analyse menée par Crawford et Meng (2011), au contraire des auteurs précédents, ne pré-

sente aucune estimation d'élasticité. Elle suit plutôt l'analyse empirique faite par Farber (2005 ;

2008), qui utilise des modèles probit a�n de déterminer la probabilité d'arrêter de travailler

suite à l'atteinte du point de référence 2. Les auteurs se basent également sur un modèle théo-

rique de préférence reference-dependent proposé par K®szegi et Rabin (2006), où le travailleur

se �xe deux cibles simultanément, l'une en terme de revenu et l'autre en terme d'heures de tra-

vail. Ainsi, travailler davantage que prévu est considéré comme une perte, tout comme le fait

de ne pas atteindre le montant désiré. Dans ce modèle, les points de référence sont déterminés

en tant qu'anticipations rationnelles, sur la base d'une moyenne des jours précédents.

En prenant soin de séparer leurs observations selon que le chau�eur fait face à un salaire plus

ou moins élevé que leur moyenne au début de son quart de travail, les auteurs estiment la

probabilité d'arrêter de travailler selon le nombre d'heures et le montant obtenu. Ils trouvent

2. Je discute ultérieurement de ces deux articles de Farber.

5

que, pour les chau�eurs faisant face à un salaire élevé, seul le nombre d'heures travaillées

a un impact signi�catif. À l'inverse, pour ceux qui observent un salaire plus faible, le seul

impact signi�catif sur la décision d'arrêter vient du revenu. Dans les deux cas, la décision

est davantage in�uencée par le second objectif atteint. Comme Crawford et Meng (2011) le

soulignent, cette inversion dans le comportement s'explique mieux par un modèle de préférence

reference-dependent. La conclusion de leur article est en faveur de ce modèle.

1.3 Les partisans du modèle intertemporel

1.3.1 Farber

Dans son premier papier sur le sujet, Farber (2005) fait le point sur la tension naturelle qui

existe entre les deux modèles. Avec des données de l'an 2000 portant sur les chau�eurs new-

yorkais, il fait ressortir des arguments en faveur du modèle néoclassique. Entre autres, en

utilisant un modèle probit, il démontre que la probabilité qu'un chau�eur décide d'arrêter

de travailler dépend davantage du nombre d'heures travaillées que du montant récolté dans

la journée. En reprenant l'analyse faite par Camerer et coll. (1997), il obtient lui aussi des

élasticités négatives (-0.637), mais souligne, comme l'ont fait les auteurs, que cette estimation

est sujette à un biais négatif 3. Farber argumente également que les salaires à travers une

même journée sont variables, mais qu'ils ne sont pas fortement corrélés d'une heure à l'autre,

ce qui le pousse à croire que ceux-ci ne peuvent être considérés comme un paramètre valide

dans la décision d'o�re de travail d'un chau�eur. Ses résultats contradictoires le poussent à

arguer que cette di�érence de conclusion entre les auteurs dépend des méthodes économétriques

utilisées. Il explore également la question d'hétérogénéité de comportement chez les travailleurs

en répétant son analyse pour chacun des chau�eurs présents dans son échantillon. En�n,

il mentionne avoir e�ectué un sondage informel auprès de plusieurs chau�eurs lors de ses

déplacements dans la ville. Ce sondage, quelque peu analogue à celui mené par Chou (2000),

lui permet d'illustrer le quotidien des chau�eurs.

En utilisant les mêmes données, Farber (2008) propose un autre modèle probit qui admet

l'existence d'un point de référence. Il obtient cette fois que la probabilité d'arrêt, une fois la

cible atteinte, est substantielle. Il trouve cependant, d'un jour à l'autre, une forte variation

dans la cible établie. Il en conclu que le pouvoir prédictif d'un point de référence sur l'o�re de

travail est � vraisemblablement très limitée �et que d'avantages de recherches sont nécessaires.

Farber (2015) réplique et allonge à nouveau l'analyse de Camerer et coll. (1997). Il se base

cette fois lui aussi sur un modèle de préférences reference-dependent avec anticipations ra-

tionnelles inspiré par celui de K®szegi et Rabin (2006). Il utilise un sous-échantillon d'une

3. Dans ces deux articles, la variable utilisée en guise de salaire horaire est calculée en prenant le revenud'un quart de travail et en le divisant par le nombre d'heures travaillées. Cette problématique sera abordéedans la section méthodologie et résultat.

6

base de données portant sur les chau�eurs new-yorkais, couvrant l'entièreté des années 2009

à 2013. Au contraire des autres études, il évite ainsi une faiblesse récurrente relativement aux

petits échantillons. Les résultats de son étude donnent à nouveau raison au modèle néoclas-

sique intertemporel. Farber distingue les variations de salaire selon qu'elles sont prévisibles ou

non et argumente qu'un modèle reference-dependent ne peut qu'expliquer une petite partie du

comportement d'o�re chez les travailleurs 4. En utilisant encore une fois un modèle de choix

discret pour estimer la probabilité d'arrêter de travailler, il rapporte que celle-ci est forte-

ment in�uencée par le nombre d'heures travaillées et, au mieux, faiblement par le revenu. Les

élasticités salaire estimées par Farber sont comprises entre 0.3672 et 0.8751 5.

Il tente à nouveau de déterminer si les deux types de comportement sont présents dans ses

données, mais n'en trouve que des preuves faibles. Il démontre en�n que les chau�eurs tendent

à devenir de meilleurs optimisateurs, c'est-à-dire à se comporter davantage selon le modèle

intertemporel, à mesure qu'ils gagnent en expérience. Aussi, les chau�eurs inexpérimentés qui

a�chent de faibles élasticités ont plus tendance à quitter l'industrie.

4. Comme je le mentionne dans la section suivante, une variation de salaire qui est prévisible pourra inciterle travailleur à revoir à la hausse son objectif de revenu. Farber trouve que seulement 1/8 des variations desalaire sont imprévisibles.

5. Pour ses régressions par variable instrumentale, avec contrôle et une fois les e�ets �xes considérés.

7

Chapitre 2

Les modèles en opposition

J'ai fait mention, à travers le chapitre précédent, des modèles de comportement d'o�re de

travail intertemporel et reference-dependent. Dans ce chapitre, je les explique plus en détail et

tente ainsi de démontrer le con�it naturel qui existe entre eux.

2.1 Le modèle intertemporel

Ce premier modèle est un cas ra�né du modèle de base en économie, où l'on permet la

projection dans le temps. Suivant celui-ci, on suppose que l'individu cherche à maximiser sa

fonction d'utilité sous une contrainte de richesse, le tout sur son horizon de vie. Ce faisant, il

plani�e donc sa consommation et ses heures de loisir (dé�ni comme le temps qui n'est pas passé

à travailler) pour chaque période de sa vie. A�n d'obtenir des résultats analytiques simples et

aisément interprétables, la forme fonctionnelle de l'utilité est souvent spéci�er comme étant

intertemporellement séparable, telle que 1 2 :

U =

T∑t=0

[G(Ct) + J(Lt)

]1

(1 + ρ)t

1. Cette hypothèse est toutefois restrictive dans la mesure où elle ne permet pas de prendre en considérationles habitudes de consommations de l'agent. Autrement dit, la consommation à une période donnée n'a�ectepas l'utilité d'une autre période.

2. De plus, la forme proposée ici est également séparable d'une manière intratemporelle, c'est-à-dire qu'onne permet pas la présence d'une complémentarité entre la consommation et le loisir pour une période donnée.

8

Où : U représente l'utilité totale ;

t représente l'indice de temps ;

G(Ct) est l'utilité instantanée de la consommation ;

Ct est le niveau de consommation au temps t;

J(Lt) représente l'utilité instantanée du loisir au temps t;

Lt est le nombre d'heure de loisir au temps t;

ρ représente le taux de préférence pour le présent.

Et où : G′(Ct) > 0 ; G′′(Ct) < 0

J ′(Lt) > 0 ; J ′′(Lt) < 0.

La contrainte de richesse quant à elle est représentée par l'expression suivante 3 :

A0 −T∑t=0

1

(1 + r)t

[Ct − st(1− Lt)

]≥ 0

Où : A0 représente la valeur des actifs de l'agent à la période initiale ;

r représente le taux d'intérêt réel du marché (constant par hypothèse) ;

st représente le salaire horaire de l'agent à la période t.

Cette dernière stipule simplement que la valeur de la consommation faite par l'individu au

courant de sa vie doit être au plus égale à sa richesse initiale plus son revenu de travail. Pour

simpli�er, on considère que l'agent ne touche aucun revenu hors travail. En�n, pour chaque

période, l'agent doit faire face à une contrainte de temps : 1 − Lt ≥ 0 (le temps total étant

normalisé à 1). Le Lagrangien du programme de maximisation de l'agent est donc représenté

par l'équation suivante :

L =

T∑t=0

(G(Ct) + J(Lt)

)1

(1 + ρ)t+ λ0

(A0 −

T∑t=0

1

(1 + r)t[Ct − st(1−Lt)

])+

T∑t=0

µt[1−Lt

]où λ0 et µt sont des multiplicateurs de Lagrange et s'interprètent respectivement comme étant

l'utilité marginale de la richesse et l'utilité marginale du travail au temps t. De celle-ci, on

3. A�n de simpli�er l'exposé, je présente ici une version du modèle où l'agent est en situation de certitudequant au futur. L'interprétation reste toutefois la même.

9

obtient les conditions de premier ordre (C.P.O.) suivantes pour t= 0, . . . , T :

δLδCt

=G′(Ct)

(1− ρ)t− λ0

(1 + r)t= 0

δLδLt

=J ′(Lt)

(1− ρ)t− stλ0

(1 + r)t= 0

δLδλ0

= A0 −T∑t=0

[Ct − st(1− Lt)](1 + r)t

= 0

δLδµt

= T − Lt ≥ 0

µt ≥ 0 ; µt[1− Lt

]= 0

Selon ce modèle, une augmentation de salaire entraine deux e�ets distincts sur la décision

d'o�re de travail, soit un e�et de substitution et un e�et de richesse. L'e�et de substitution

re�ète l'e�et d'un changement dans le rapport des prix sur la demande d'un bien, tel que le

niveau d'utilité reste constant. Dans le modèle néoclassique dynamique tel que celui-ci, il existe

deux types d'e�ets de substitution, soit celui à l'intérieur d'une période (intratemporel) et celui

entre les périodes (intertemporel). L'e�et intratemporel s'observe directement en prenant le

rapport entre les deux premières C.P.O sur une même période t. Celui-ci nous indique le taux

auquel l'agent acceptera d'échanger du loisir contre de la consommation à cette période (pour

une solution intérieure où µt = 0). On le dénote :

TMSintra = st =J ′(Lt)

G′(Ct).

Le salaire étant le prix d'une heure de loisir, une augmentation de celui-ci incite le travailleur

à diminuer sa demande d'heure de loisir. De façon équivalente, l'augmentation de salaire rend

le travail plus attrayant et incite à augmenter l'o�re de travail 4.

2.1.1 Variations transitoires et permanentes des salaires

A�n de rendre lisse son niveau de consommation entre les di�érentes périodes de sa vie,

le travailleur a la possibilité de substituer le nombre d'heures travaillées entre celles-ci. Par

exemple, sachant qu'il sera un jour à la retraite, l'agent pourra prendre la décision de travailler

davantage et de consommer moins lors de sa vie active pour en tirer pro�t lors de ses vieux

jours, tout en conservant un niveau de consommation relativement constant. À travers les

lignes suivantes, je tente d'illustrer par quel mécanisme le modèle intertemporel tient compte

des changements dans l'o�re de travail lors d'une variation de salaire entre les périodes.

4. Il est toutefois important de noter que ce résultat est une conséquence directe de l'hypothèse de sépara-bilité intertemporelle l'utilité.

10

Toujours avec les deux premières C.P.O., il est possible de tirer directement les fonctions de

demande de consommation et de loisir, respectivement formulées :

Ct = G′−1

([(1− ρ)

(1 + r)

]tλ0

); Lt = J ′−1

([(1− ρ)

(1 + r)

]tλ0st

).

La dé�nition d'une heure de loisir implique que l'o�re de travail dépend des mêmes paramètres

et est formulée telle que :

Ht = 1− Lt = 1− J ′−1

([(1− ρ)

(1 + r)

]tλ0st

).

On constate aisément que ces fonctions dépendent de l'utilité marginale de la richesse λ05.

Ce paramètre peut être perçu comme étant une statistique exhaustive résumant l'e�et des

variables monétaires des autres périodes 6. Pour s'en convaincre, il su�t de remplacer les

fonctions de demande de consommation et de loisir dans la troisième C.P.O. pour obtenir

l'expression (implicite) de λ0 suivante :

A0 −T∑t=0

1

(1 + r)t

[G′−1

([1− ρ1 + r

]tλ0

)− st

(1− J ′−1

([1− ρ1 + r

]tλ0st

))]= 0.

Ainsi, les demandes de consommations et de loisir, de même que l'o�re de travail, sont a�ec-

tées par les salaires passés et futurs seulement à travers λ0. C'est l'e�et richesse mentionné

plus tôt. On peut voir que, pour un horizon T su�samment large, une augmentation de salaire

n'a�ectant qu'une seule période (variation transitoire) n'aura pratiquement pas d'in�uence sur

λ0 puisque son importance sera négligeable. Par contre, cette augmentation a�ectera directe-

ment et positivement l'o�re de travail pour la période en question. Inversement, dans le cas

d'une augmentation permanente du pro�l des salaires, l'utilité marginale de la richesse sera

plus fortement a�ectée. Si tous les salaires augmentent d'une même proportion, λ0 sera divisée

d'autant. Au niveau de l'o�re de travail au temps t, l'e�et de la variation de λ0 annulera celui

du salaire st.

En résumé, dans la mesure où le loisir est considéré comme un bien normal, l'e�et richesse incite

l'agent à revoir son o�re de travail à la baisse suite à une augmentation de salaire. Des e�ets

richesse et substitution, l'un sera dominant et in�uencera le nombre d'heures de travail o�ertes.

Selon que l'augmentation est permanente ou temporaire, l'e�et dominant sur la décision des

heures travaillées peut être di�érent. Dans le cas d'une augmentation permanente et égale pour

toutes les périodes, les deux e�ets sont présents et s'annulent. S'il s'agit au contraire d'une

5. Par conséquent, il ne s'agit pas ici de fonctions de demande classiques.6. Par variables monétaires, j'entends surtout les salaires, mais également les taux d'intérêts et de préférence

pour le présent.

11

augmentation transitoire, l'e�et richesse sera généralement négligeable et l'e�et substitution

dominera, entrainant une augmentation de l'o�re de travail.

Lors de l'estimation d'une fonction d'o�re de travail, considérer λ0 comme une constante

revient à se poser dans une perspective de variation de salaire transitoire, tel que précédemment

décrit. Ce type d'o�re porte le nom d'o�re de travail frischienne 7.

2.2 Le modèle reference-dependent

Ce modèle alternatif souvent proposé dans la littérature prend son origine dans la théorie de

l'individu averse à la perte 8. Il s'agit également d'un modèle de maximisation d'utilité, mais

pour lequel la fonction qui est maximisée contient au moins une composante qui est évaluée

relativement à un point de référence subjectif à l'individu.

L'aversion à la perte se traduit, au niveau de la fonction d'utilité, par une valeur associée aux

pertes plus élevée (en absolu) par rapport aux gains. Dit autrement, |f(−x)| > |f(x)|. Ainsi, ladésutilité ressentie par l'individu qui se trouve sous son point de référence d'un montant x sera

supérieure à l'utilité de dépasser ce même point par un montant x. On considère également

que la sensibilité de l'individu face aux gains et aux pertes est généralement décroissante.

Contrairement à l'hypothèse très semblable d'utilité marginale décroissante, celle-ci n'implique

notamment pas que la fonction d'utilité soit concave sous le point de référence.

Cependant, le contexte auquel je désir appliquer ce modèle nécessite un ajustement de la fonc-

tion d'utilité. Soit un travailleur qui se �xe une cible en terme de revenu. Même si celle-ci

n'est pas atteinte, le travailleur retirera tout de même une certaine dose d'utilité de sa rému-

nération. C'est pourquoi il est nécessaire d'ajouter à cette fonction une composante � utilité

de consommation �qui attribue une valeur à ce montant. La représentation graphique devient

maintenant plus familière, semblable à la �gure 2.1, où I, T , L et w sont respectivement le

revenu, le point de référence, les heures de loisir et le salaire 9.

Formellement, tel que le fait Farber (2015), il est possible de représenter l'utilité d'un tel

travailleur par la fonction suivante :

U(h) =

a(wh− T )− h1+σ si wh− T < 0

b(wh− T )− h1+σ si wh− T ≥ 0

7. Dans la mesure où λ0 est constant, mais di�ère d'un travailleur à l'autre, l'estimation adéquate desparamètres d'une fonction frischienne nécessite de prendre en compte la présence d'e�ets �xes (MaCurdy,1981).

8. Voir Kahneman and Tversky (1979) et Tversky et Kahneman (1991)9. La �gure représente le cas linéarisé a�n de facilité la distinction par rapport à la fonction d'utilité usuelle.

Cela est équivalent à relâcher l'hypothèse de sensibilité décroissante.

12

U(I)

IT

I

L

U1

T

w

Figure 2.1 � Fonction d'utilité et courbre d'indiférence reference-dependent linéarisé.

où I = wh est le revenu, T est l'objectif de l'individu en terme de revenu, w est le salaire

horaire, h est le nombre d'heures travaillées, a > b > 0 sont des coe�cients qui servent à

contrôler l'utilité marginale avant et après l'atteinte de l'objectif et σ > 0 est un paramètre

a�ectant l'élasticité salaire de l'o�re. Les prédictions du modèle reference-dependent sont les

suivantes 10 :

� Si I − T < 0 l'équation d'o�re de travail est donnée par

h∗ =( aw

1 + σ

) 1σ

et l'élasticité salaire de l'o�re est

1

σ> 0.

Cela implique qu'à de faibles niveaux de salaire, c'est-à-dire des salaires qui ne per-

mettent pas au travailleur d'atteindre son objectif à l'intérieur d'une période de travail

donnée, ce dernier se comporte de manière similaire au modèle intertemporel. Ainsi,

une augmentation de salaire temporaire dans cet intervalle se traduit par une augmen-

tation de l'o�re de travail. Si l'on se pose dans le contexte d'un chau�eur de taxi, ce

modèle prédit que le chau�eur sillonnera les rues de la ville, peinant à trouver des

clients, jusqu'à ce qu'il décide que le salaire n'en vaille plus l'e�ort.

10. Voir l'annexe 1 pour les développements complets.

13

� Si I − T = 0 l'o�re de travail est donnée par

h∗ =T

w

et l'élasticité salaire de l'o�re est égale à -1.

Aussitôt que le salaire est assez élevé pour atteindre sa cible, le chau�eur travaillera

jusqu'à l'atteinte de celle-ci mais pas davantage. Ce dernier se comporte ainsi sur un

certain intervalle de salaire. Dans cet intervalle, il considère le salaire plus élevé que la

valeur qu'il accorde à une heure de loisir, mais considère également qu'il ne vaut pas la

peine de travailler davantage. Cela implique qu'une augmentation de salaire contenue

dans cet intervalle entrainera une diminution de l'o�re de travail, puisque l'objectif est

atteint de plus en plus rapidement.

� Si I − T > 0 l'o�re de travail est donnée par

h∗ =( bw

1 + σ

) 1σ

et l'élasticité salaire est à nouveau égale à

1

σ> 0.

Ici la seule di�érence avec le cas Y − T < 0 est la substitution des paramètres a et b.

Comme ce sont deux paramètres positifs, les prédictions sont essentiellement les mêmes.

Ainsi, lorsque le salaire se trouve à des niveaux supérieurs, le travailleur recommence à

avoir un comportement similaire au modèle intertemporel. À ces niveaux, le chau�eur

atteindra sa cible rapidement et à ce point réalisera que son salaire est au moins égal

au montant pour lequel il serait prêt à continuer de travailler. Ainsi la relation entre

heures travaillées et salaire redevient positive.

Économiquement, cette structure à trois intervalles peut sembler curieuse. Il s'agit ici des

prédictions mathématiques du modèle. Pour que celles-ci tienne la route, il serait nécessaire

de poser des hypothèses supplémentaires, à savoir, que le chau�eur �xe son objectif avant

de commencer à travailler et que celui-ci ne puisse être modi�é une fois qu'il a commencé à

travailler. Supposons un chau�eur en présence d'un salaire en dessous de ses attentes, qui ne

lui permet pas d'atteindre sa cible. Ce dernier cherchera à minimiser la désutilité associée au

fait de manquer sa cible et travaillera jusqu'à ce que cela lui soit trop pénible. Si au contraire

on permet au travailleur de réviser sa cible, alors celui-ci devrait logiquement la déterminer

de façon à ce qu'elle soit atteignable avec le taux horaire qu'il observe. En procédant ainsi, il

se trouvera à l'endroit où l'élasticité salaire de l'o�re est négative.

14

Comme je l'ai mentionné plus tôt dans la revue de littérature, les points de référence des

chau�eurs sont déterminés selon le principe des anticipations rationnelles. Plus précisément,

cette cible serait basée sur le revenu espéré, lui-même fonction de l'espérance des salaires

précédents et du nombre d'heures que le chau�eur désire travailler à ce niveau de salaire.

Il est donc important de mentionner que cette structure de comportement n'est valide que

pour les variations de salaires qui sont imprévisibles et temporaires. En e�et, si le travailleur

est au fait d'un évènement futur quelconque qui aura un impact sur son salaire, celui-ci sera en

mesure de �xer une cible en conséquence, ce qui aura potentiellement sur son o�re de travail

un e�et similaire au modèle intertemporel. En�n, pour que la relation négative puisse être

observée, les variations de salaire doivent se trouver relativement près du point de référence, au

risque d'amener le travailleur dans l'une des � zones intertemporelles �. Ainsi, ces nombreuses

conditions font en sorte que l'intervalle de salaire dans lequel le modèle reference-dependent

est pertinent devient relativement court (Farber 2015).

2.3 Distinction des modèles

En résumé, le modèle intertemporel prédit une augmentation de l'o�re de travail suite à

une variation temporaire du salaire. À l'opposé, le modèle reference-dependent prédit qu'une

diminution de l'o�re sera causée par une augmentation temporaire et imprévue du salaire,

dans la mesure où celle-ci se situe dans un certain intervalle autour du point de référence de

l'individu. Puisque, comme les études présentées plus tôt, je cherche à déterminer lequel de ces

deux modèles explique le mieux le comportement des chau�eurs de taxi, il me faut trouver une

source de variation de leur salaire qui soit temporaire et imprévisible. Par conséquent, je retiens

les conditions météorologiques comme causes de telles variations. Celles-ci sont évidemment

temporaires et, comme je le véri�e dans la section des résultats, l'ampleur de leur impact sur

le niveau de salaire est relativement imprévisible. Je fais l'hypothèse que le mauvais temps

entraine une hausse dans la demande de services de taxi. Cette hausse de demande se traduit

pour les chau�eurs par une plus grande aisance à trouver des opportunités de courses. Comme

un chau�eur tire son revenu du nombre de courses qu'il e�ectue, il s'ensuit pour lui une

augmentation de revenu. Ce montant divisé par le nombre d'heures travaillées sera ma mesure

pour le salaire.

Au �nal, si les chau�eurs se comportent conformément au modèle intertemporel, ils répondront

aux mauvaises conditions météorologiques en travaillant plus longtemps. Si au contraire le mo-

dèle reference-dependent est celui qui est suivi, les chau�eurs diminueront la quantité d'heures

travaillées lors de journées pluvieuses (à condition de se trouver dans l'intervalle pertinent).

15

Chapitre 3

Les données

Dans ce chapitre, je discute des données utilisées a�n de départager les deux modèles. J'y

décris les manipulations e�ectuées pour en faire le nettoyage. Je décris ensuite les données de

façon sommaire. Je termine en expliquant les raisons derrière l'utilisation de ces données.

3.1 Source et manipulations

A�n de réponde à ma question de recherche, j'utilise une base de données portant sur l'industrie

du taxi new-yorkais. Ces données sont disponibles directement sur le site internet de la Taxi

and Limousine Commission (TLC) de la ville de New York, qui est l'agence gouvernementale

municipale en charge de réguler l'industrie 1. Créée en 1971, la commission a comme rôles

principaux de délivrer les permis nécessaires, �xer les tarifs et procéder à l'inspection des

véhicules.

Au moment d'écrire ces lignes, les données disponibles couvrent la totalité des courses e�ec-

tuées pour les années 2009 à 2015. Elles contiennent de l'information sur l'endroit ainsi que

la date exacte de départ et d'arrivée, la distance parcourue, le tarif en vigueur ainsi que le

nombre de passagers (rapporté par le chau�eur). Pour chaque course, le numéro de licence du

chau�eur est disponible. Vu l'importante taille de ces données, je restreins mon analyse sur

les 168 793 839 courses e�ectuées au cours de l'année 2013.

Ces données sont récoltées et colligées de manière électronique à travers les compteurs présents

à l'intérieur de chaque taxi, pour le compte de la TLC. Comme c'est souvent le cas, et bien que

le processus de récolte d'information soit automatisé, mes données sous leur forme brute ren-

ferment certaines incongruités. Par exemple, certaines observations montrent des courses dont

les points de départ ou d'arrivée se retrouvent en pleine mer. D'autres encore se feraient à des

vitesses largement supérieures aux limites légales. Quelques chau�eurs, à l'image d'un numéro

1. Nous sommes redevables de l'accessibilité publique de ces données à M. Christopher M. Whong, qui en2014 en a fait la demande auprès de la commission sous le couvert de la Freedom of Information Law

16

de cirque, auraient réussi à entasser au-delà de 200 passagers dans leur véhicule. Quoique dans

plusieurs cas le reste des informations soient raisonnables, ces incongruités démontrent que les

procédés technologiques ne sont pas infaillibles. Pour cette raison, je procède au nettoyage des

données en leur imposant certaines conditions logiques.

En utilisant l'information sur les points de départ et d'arrivée, qui suivent le système GPS,

je restreins la localisation d'une course à l'intérieur du territoire américain, à l'exception de

l'État d'Alaska. Toutes courses lors desquelles le rapport de distance/temps dépasse la limite

de 85miles (136,8 km) par heure est écartée 2. Toute observation pour laquelle le nombre de

passagers est supérieur à 30 est retirée, ce qui permet de conserver les cas particuliers où le

véhicule est une limousine 3. En�n, est supprimée toute course qui a�che un tarif négatif ou

qui se termine plus tôt qu'elle ne débute.

Une fois le nettoyage e�ectué, ma base de données, sous sa forme où chaque observation repré-

sente une course, contient 167 951 567 observations. Ce sont donc 0,5% des données qui ont été

supprimées. J'ajoute ensuite à ma base de données de l'information sur la température, colli-

gée par le Network for Environment and Weather Applications (NEWA) 4. Le NEWA est un

réseau de stations météorologiques réparties dans le nord-est des États-Unis, qui enregistrent

des données à toutes les heures. La station consultée est NYC-Central Park. À chacune des

courses donc, sur la base de son heure de départ, est associées la température (°F), le taux de

précipitation de pluie (mm/h) ainsi que la vitesse du vent (km/h) correspondante.

Dans le tableau 3.1, je présente un sommaire des variables continues de ma base de données.

En utilisant l'information relative aux dates précises lors desquelles les courses sont e�ectuées,

je suis en mesure de connaître le mois, le jour et le moment de la journée pour chacune de

ces observations. Cela me permet également d'identi�er les jours de fête les plus susceptibles

d'avoir un impact sur les déterminants du marché. La distribution des courses dans le temps,

selon chacune de ces catégories, est présentée dans le tableau 3.2. Par exemple, 13.23% des

courses e�ectuées en 2013 ont débuté un lundi ; 9.09% lors du mois de mars, 0.27% lors de la

journée du Super Bowl et 12,87% ont commencé la nuit 5.

Puisque mon intérêt porte sur l'o�re de travail chez les chau�eurs, j'aurai également besoin

d'une base de données contenant de l'information sur la durée des périodes travaillées. Je

dé�nis donc, pour chaque chau�eur, un quart de travail comme étant une période de travail

2. Il s'agit ici de la limite légale la plus élevée, tous États confondus. Elle correspond à celle du Texas surla grande route interÉtats en milieu rural.

3. Comme en témoigne le site internet de la TLC, il existe une o�re de service relative aux limousines. Leclient doit en faire le préarrangement auprès d'une compagnie spécialisée. La limite de 30 a été retenue sur labase des produits o�erts par ces di�érentes compagnies. Toutefois, il semblerait que le groupe de client le plusnombreux pour l'année étudiée ait été composé de 9 personnes.

4. Le NEWA a été fondé en 1995 par le New York State Integrated Pest Management (IPM) et est �nancé,à travers celui-ci, par l'État de New York et la Cornell University (entre autres).

5. Je sépare une journée en quatre périodes de 6 heures, avec la nuit commençant à 00h00 et terminant à6h00

17

Table 3.1 � Description des données sous forme par course

Variables Moyenne Écart-Type Min. Max.Nombre de passagers 1.711 1.3759 1 9Temps (min) 12.64 9.35 0.02 332Distance (km) 4.673 5.415 0 365.882Prix total ($) 14.75 11.84 0 600Température (°F) 55.37 17.79 11 97Pluie (mm/h) 0.144 0.9874 0 26.924Vitesse du vent (km/h) 9.361 6.077 0 44.418

Table 3.2 � Distribution des courses selon le temps

Jour PériodeLundi 13.23 %Mardi 14.26 %

Mercredi 14.42%Jeudi 14.74%

Vendredi 15.22%Samedi 15.15%

Dimanche 12.97%

Matin 24.06 %Après-midi 28.42 %

Soir 34.66 %Nuit 12.87 %

Fêtes Mois

Nouvel An 0.24%Super Bowl 0.27%

Saint-Valentin 0.3%Pâque 0.26%

Jour du souvenir 0.19%4 juillet 0.19%

Fête du travail 0.19%Action de Grâce 0.19%

Noël 0.14%Veille du jour de l'an 0.27%

Janvier 8.51 %Février 8.06 %Mars 9.09 %Avril 8.73 %Mai 8.51 %Juin 8.32 %

Juillet 8.03 %Août 7.34 %

Septembre 8.23 %Octobre 8.75 %

Novembre 8.33 %Décembre 8.1 %

d'une durée d'au moins 30 minutes, séparée d'une autre par au moins 6 heures sans qu'aucune

course ne soit e�ectuée. À partir de cette dé�nition (empruntée à Farber(2015)), il m'est

possible de transformer les données sous leur forme par course pour les avoir par quart de

travail. Sous cette forme, je possède de l'information sur le nombre de courses e�ectuées, le

temps total passé avec un client, la distance totale parcourue avec un client, le revenu total

des courses e�ectuées ainsi que la moyenne de la température, de la vitesse du vent et des

précipitations. La durée du quart est quant à elle calculée comme étant la di�érence entre la

date de �n de la dernière course et la date de début de la première 6. Le tableau 3.3 présente

6. Pour pouvoir travailler avec les variables de temps, Stata attribue un nombre entier à chaque milliseconde.

18

de l'information sur la distribution de ces variables.

Table 3.3 � Description des données sous forme par quart

Variables Moyenne Écart-Type Min. Max.Durée du quart (h) 8.51 3.34 0.5 199.99Nombre de courses 21.59 9.464 1 476Nombre de passagers 36.955 34.396 1 2061Temps total avec client (min) 272.31 108.1 0.05 8 438Distance totale avec client (km) 100.95 43.185 0 3168.21Revenu total des courses ($) 318.21 122.46 0.01 8757.04Précipitation moyenne (mm/h) 0.1379 0.5637 0 26.92Vitesse du vent moyenne (km/h) 9.1539 4.3651 0 44.4178Température (°F) 56.5638 17.7413 11 97

3.2 Pourquoi l'industrie du taxi ?

L'utilisation de données portant sur le marché du taxi new-yorkais s'explique par la composi-

tion de l'industrie. Les taxis jaunes iconiques de la ville, seuls autorisés à prendre des clients

les ayant hélés dans les rues de Manhattan, se divisent selon deux types de médaillons 7. Les

� médaillons de �otte �identi�ent les taxis appartenant à une sorte de garage et qui sont loués

à des chau�eurs possédant eux-mêmes une licence. Pour ce type de médaillon, le propriétaire

doit en posséder au minimum deux et chacun de ceux-ci doit être en activité pendant au moins

neuf heures, deux fois par jour. L'autre type, les médaillons indépendants, sont quant à eux

attribués individuellement. Le propriétaire de ce type de médaillon a lui aussi la possibilité

d'en faire la location auprès d'un chau�eur.

L'entente généralement établie entre le propriétaire et le locataire est que les frais de la période

de location sont avancés par ce dernier. Une fois ces frais et le coût de l'essence encourus,

le locataire peut conserver la totalité du revenu des courses e�ectuées. Ainsi, qu'ils soient

propriétaires ou non, les chau�eurs internalisent les coûts de production et sont libres de

décider du nombre d'heures qu'ils travaillent 8. Il s'agit donc d'un cadre idéal a�n de tester

des modèles de comportement d'o�re de travail qui se base sur une maximisation d'utilité

(Chou 2002, Farber 2015).

Le point de référence étant le 1er janvier 1960, la valeur de 0 lui est attribuée. Ainsi, une di�érence de dateest équivalente au temps écouler depuis le temps 0.

7. Un médaillon étant une sorte de licence attachée au taxi8. On ne les voit pas contraints de respecter un certain nombre d'heures par semaine. Les primes associées

aux heures supplémentaires, souvent source de réticence chez les employeurs, ne sont pas présentent dans cetteindustrie.

19

3.3 Sur l'utilisation de grandes bases de données

Bien que l'utilisation d'un échantillon d'aussi grande taille apporte une meilleure précision

aux estimations, celle-ci entraine également quelques complications. En plus de l'intensité

des calculs, l'une des principales complications vient des méthodes d'inférences statistiques,

généralement utilisées sur des échantillons de petite taille, qui peuvent mener à des conclusions

trompeuses ou inexactes (Lin, Lucas et Shmueli 2013). Entre autres, un problème connu sous

le nom de � problème de la p-value �, où on attribue une signi�cativité à des e�ets in�mes,

est souvent rencontré. A�n de se garantir des pièges causés par ce phénomène, Lin, Lucas et

Shmueli (2013) proposent plusieurs solutions simples.

Parmi celles-ci, les auteurs recommandent aux chercheurs d'être textuellement clairs quant à

l'interprétation des paramètres et des e�ets estimés. Autrement dit, les chercheurs ne devraient

pas simplement s'attarder au signe et au niveau de signi�cativité du paramètre, mais également

à l'ampleur de celui-ci. De plus, ils recommandent de rapporter ces e�ets en spéci�ant un

intervalle de con�ance. Ceci a deux avantages. Le premier est que contrairement à la p-value

qui indique seulement la probabilité de rejeter l'hypothèse nulle sans se tromper, l'intervalle de

con�ance donne une meilleure idée de l'ampleur de l'e�et estimé. Le second avantage est qu'il

devient bien plus facile de comparer les résultats entre les di�érentes études, faire la synthèse

de celles-ci et ainsi contribuer à l'avancement des connaissances. Le reste des suggestions des

auteurs impliquent principalement des représentations graphiques servant à illustrer l'évolution

des estimations à mesure que la taille de l'échantillon augmente.

Ainsi, je devrai rester prudent lors de l'interprétation de mes résultats. Pour me prémunir

le plus possible des problèmes associés à la grande taille de ma base de données, j'essaierai

d'appliquer au mieux possible les principales recommandations de cette étude.

Une autre alternative simple, proposée entre autres par Greene(2003), serait de simplement

diminuer, à mesure que la taille de l'échantillon augmente, le seuil auquel on admet la si-

gni�cativité. Par contre, cette méthode reste très subjective et il n'existe aucune règle pour

déterminer ce seuil (Lin, Lucas et Shmueli 2013).

20

Chapitre 4

Méthodologie et résultats

Dans ce chapitre, je présente les résultats de mes estimations, en expliquant au passage la

méthodologie utilisée. Je débute par la véri�cation des hypothèses relativement au contexte

proposé par Camerer et coll. (1997). J'estime ensuite l'importance que peut prendre le modèle

reference-dependent dans l'explication du comportement d'o�re de travail chez les chau�eurs

de taxi. J'enchaîne en observant comment se comporte le marché lors d'un épisode de mauvaise

température. Vient ensuite l'estimation d'élasticités salaire de l'o�re, en tenant compte d'un

problème d'endogénéité.

4.1 Véri�cation d'hypothèses

4.1.1 Autocorrélations des salaires

Comme je le mentionne dans ma revue de littérature, Camerer et coll. (1997) suggèrent l'uti-

lisation d'un contexte où le salaire horaire est relativement constant à travers les heures d'une

même journée et n'est pas corrélé d'une journée à l'autre. Je m'assure donc ici que c'est bel

et bien le cas.

Dans un premier temps, je véri�e l'autocorrélation des salaires à travers les heures d'une même

journée. Pour ce faire, je calcule d'abord le salaire horaire médian à chacune des heures de

l'année. J'observe ensuite le coe�cient de corrélation linéaire entre les salaires médians des

heures i et i−1, dont la valeur est de 0,86. Cette valeur, positive et proche de 1, indique que la

relation du salaire médian avec lui-même à l'heure précédente s'approche d'une droite de pente

unitaire positive. Par conséquent, cela nous indique que si le salaire médian à l'heure i − 1

est par exemple de 15$, une heure plus tard celui-ci sera toujours autour de 15$. Autrement

dit, le salaire horaire est en e�et relativement constant d'une heure à l'autre (ou à travers

la journée). L'importance de véri�er cette autocorrélation vient du fait que, si celle-ci est

négative, un chau�eur suivant le modèle néoclassique se comportera de telle manière qu'il

dérogera des prédictions du modèle. En e�et, si celui-ci observe un salaire élevé au début de

21

son quart de travail, il arrêtera tôt, sachant que les salaires à venir seront vraisemblablement

faibles. Inversement, constatant un faible salaire en début de journée, il travaillera longtemps,

s'attendant à des salaires élevés éventuels. Puisque la corrélation que j'observe est forte et

positive, je peux écarter cette possibilité.

A�n de véri�er le niveau d'autocorrélation des salaires d'une journée à l'autre, je procède de

manière similaire. Je calcule d'abord la médiane des salaires médians pour chaque jour de mon

échantillon, pour ensuite véri�er le coe�cient de corrélation entre les jours j et j−1. La valeur

obtenue de 0,57 m'indique que, bien qu'elle ne soit pas particulièrement forte, il existe tout

de même une corrélation linéaire entre les salaires d'un jour à l'autre. Ainsi, il semble que les

variations de salaires dont sont témoins les chau�eurs ne soient pas totalement transitoires.

Toutefois, cette faible corrélation s'explique certainement en partie par une sorte d'e�et de

cycle dans les jours de la semaine et en admettant ceci, il ne me semble pas totalement absurde

de croire que le contexte d'un chau�eur de taxi puisse être utilisé a�n de tester le comportement

d'un travailleur suite à une variation temporaire de son salaire.

4.1.2 Mesure de l'importance du modèle Reference-Dependent

Comme je le mentionne dans ma présentation des modèles, le comportement associé au modèle

reference-dependent, soit la diminution de l'o�re de travail suite à une augmentation du salaire,

n'est valide que pour les variations imprévisibles. Si par exemple le chau�eur est en mesure de

prévoir l'amplitude d'une augmentation, il lui sera possible de se �xer une cible plus élevée.

Il y a donc une possibilité de confusion entre les deux modèles. A�n de constater dans quelle

proportion le modèle alternatif peut expliquer le comportement des chau�eurs, je tente de

mesurer la capacité de prédiction des variations de salaire de ces derniers.

Pour ce faire, j'utilise mes données sous une forme où chaque observation représente une heure

de l'année. Je procède avec une simple régression par moindres carrés ordinaires (MCO) du

revenu moyen des chau�eurs dans l'heure sur des variables de température et des indicatrices

de temps. Les variables de température incluent les précipitations de pluie, la vitesse du vent,

l'interaction de celles-ci ainsi que la température. Les variables de temps quant à elles indiquent

la période du jour, le jour de la semaine, le mois et les jours de fête.

De cette régression, on peut tirer le coe�cient de détermination ajusté (ou R2), valeur située

en 0 et 1 qui donne la mesure du pouvoir explicatif du modèle. Dans cette application, cette

valeur s'interprète donc comme la capacité du chau�eur à prédire les salaires horaires à venir.

Comme 0 < R2 < 1, il s'en suit que 1 − R2 donne la mesure d'imprévisibilité. La régression

me donne un R2 = 0, 028, ce qui implique donc que 1 − R2 = 0, 972. Ainsi, près de 97% de

la variation des salaires est imprévue par les chau�eurs. Conséquemment, le comportement

d'o�re de travail chez les chau�eurs de taxi new-yorkais peut s'expliquer dans une même

22

proportion par le modèle reference-dependent. 1

4.2 Les réactions du marché face à la pluie

Avant d'enchaîner avec l'estimation d'élasticités salaire de l'o�re de travail, j'analyse le com-

portement des di�érentes caractéristiques du marché lorsque celui-ci vit un épisode de mauvais

temps. En prenant comme point de départ mes données sous leur forme où chaque observation

représente une course, je transforme celles-ci pour les avoir sous une forme où chaque observa-

tion représente une heure de l'année. Il m'est ainsi possible d'observer pour chaque heure : le

salaire horaire ; le temps moyen (en minutes) passé avec un client à bord par les chau�eurs ; la

distance moyenne parcourue (en km) avec un client ; le nombre de courses e�ectué ainsi que

le nombre de taxis sur les routes.

A�n de mesurer la variation de chacune de ces caractéristiques, j'ai encore une fois recours

à la méthode de régression par MCO. Dans tous les cas, les variables explicatives sont mes

données de température. Je regarde également, en utilisant mes données sous leur forme où

chaque observation représente un quart de travail, l'e�et de ces variables sur la durée moyenne

de celui-ci. En�n, les variables expliquées sont toutes en logarithmique, ce qui me donne des

semi-élasticités. Les résultats de ces di�érentes régressions, avec et sans contrôle pour le temps,

sont respectivement rapportés dans les tableaux 4.2 et 4.1 2. Entre parenthèses sont indiqués

les écarts-types, alors que les intervalles de con�ance à 95% sont rapportés entre crochets. Les

résultats dont je fais mention dans le texte sont ceux des régressions avec contrôles.

Dans chacun des tableaux, la première rangée indique les coe�cients pour la régression sur

le salaire horaire. Pour chaque millimètre de pluie supplémentaire par heure, le salaire ho-

raire augmente en moyenne de 0,51%, dans l'intervalle [0,48% ; 0,54%]. La vitesse du vent

a également un impact positif, avec une augmentation de 0,07% [0,068% ; 0,074%] par kilo-

mètre/heure supplémentaire. L'e�et d'interaction donne un coe�cient négatif, mais très faible

et seulement signi�catif à 5%, situé dans l'intervalle [-0,0049% ; -0,0002%] 3 4. Pour chaque °F

supplémentaire, le salaire diminue de 0,02% [-0,0235% ; -0,0199%]. Ainsi dans l'ensemble, le

mauvais temps semble augmenter les opportunités de revenu pour les chau�eurs. L'impact le

1. Il serait certainement possible d'améliorer le modèle en ajoutant des variables explicatives pertinentessupplémentaires. Cependant, cette information ne m'est pas disponible. Il y a fort à parier qu'un chau�eurmoindrement expérimenté ait une meilleure capacité de prédiction. Toutefois, il semble plausible de croire quele niveau d'imprévisibilité reste grand.

2. Les contrôles de temps sont les mêmes indicatrices pour les fêtes, mois, jour de la semaine et période dela journée.

3. L'interaction entre la pluie et le vent permet de déterminer si le mauvais temps a un e�et sous-additif(ou super-additif) sur les variables expliquées. Une fonction est dite sous-additive si f(x1+x2) ≤ f(x1)+f(x2).Ici par exemple, avec les e�ets de la pluie et du vent positifs, l'e�et d'interaction négatif indique une sous-additivité. Ainsi, lors d'une journée pluvieuse, l'e�et marginal du vent sur le salaire horaire sera moins élevéque lors d'une journée sans pluie. Le même raisonement s'applique pour l'e�et marginal de la pluie.

4. La majorité des coe�cients sont signi�catifs à des seuils inférieurs à 0,1%. En prenant en considérationle problème de la p-value, cet e�et est sans doute négligable.

23

plus important provient du niveau de précipitations.

La seconde ligne rapporte les coe�cients de la régression sur le temps passé avec un client.

En moyenne, un millimètre de précipitation supplémentaire entraine une augmentation du

nombre de minutes par heure passée avec un client de 1,59% [1,56% ; 1,62%]. Le vent aug-

mente la durée de 0,21% [0,205% ; 0,211%] par kilomètre/heure et la température de 0,07%

[0,076% ; 0,08%] par °F. L'e�et d'interaction est toujours faible et négatif avec un coe�cient

de -0,009% [-0,0117% ; -0,0064%]. Ces résultats indiquent qu'un épisode de mauvais temps

augmente probablement la demande pour les courses de taxi.

La troisième rangée des tableaux 4.1 et 4.2 rapporte les résultats de la régression sur la distance

parcourue par heure avec un client. L'e�et d'un millimètre de pluie est d'une diminution de

0,23% [-0,273% ; -0,20%] de la distance moyenne par heure. Pour ce qui est de l'intensité du

vent, il s'en suit une diminution de 0,05% [-0,056% ; -0,049%] par km/h supplémentaire. De

même, chaque °F de plus diminue de 0,1% [-0,0998% ; -0,0951%] cette distance. L'interaction

de la pluie et du vent a�che un coe�cient positif de 0,01% [0,008% ;0,014%]. Ainsi, le mauvais

temps diminue la distance moyenne parcourue avec un client par les chau�eurs de taxi.

Les résultats présentés dans la quatrième rangée sont ceux de la régression sur le nombre

de courses e�ectuées par heure. Le millimètre de pluie additionnel augmente en moyenne le

nombre de courses de 0,13% [0,061% ; 0,20%]. Pour le vent, le kilomètre/heure additionnel en-

traine une augmentation de 0,23% [0,221% ; 0,23%]. L'e�et d'interaction est également positif

à 0,09% [0,083% ; 0,093%]. Quant à l'e�et de la température, l'augmentation d'un °F fait dimi-

nuer en moyenne le nombre de courses par heure de 0,1% [-0,1076% ; -0,0997%]. Ces résultats

indiquent qu'une mauvaise température semble augmenter les opportunités de courses.

Les coe�cients obtenus par la régression sur le nombre de taxis avec un client sur les routes

sont indiqués à la cinquième rangée des tableaux 4.1 et 4.2. La pluie fait augmenter le nombre

de taxis qui sont en fonction de 1,74% [0,075% ; 3,4%] par millimètre supplémentaire. Cet e�et

n'est toutefois signi�catif qu'à partir du seuil de 5%. Le vent a lui aussi un e�et positif de

0,33% [0,19% ; 0,47%] par km/h. L'e�et d'interaction est négatif à -0.11% [-0,25% ; -0,022%]

mais non signi�catif. Pour la température, chaque degré de plus augmente de 0,38% [0,2884% ;

0,4799%] le nombre de taxis. Ainsi, encore une fois, le mauvais temps semble avoir un impact

positif sur les opportunités de courses.

À la lumière des résultats obtenus jusqu'à présent, il semble que le modèle de comportement

dominant soit le modèle néoclassique. En e�et, la mauvaise température semble engendrer

une augmentation de la demande, comme en témoigne l'augmentation du temps passé avec un

client et la diminution dans la distance parcourue (régressions 2 et 3). Celle-ci, tel qu'indiqué

par la première régression, crée à son tour une opportunité pour les chau�eurs d'augmenter

leur revenu. Ces derniers répondraient positivement, en augmentant le nombre de courses

e�ectuées et par une présence accrue sur les routes (régressions 4 et 5).

24

En�n, la dernière rangée rapporte les coe�cients de la régression sur la durée du quart de

travail. Chaque millimètre de plus dans l'intensité des précipitations fait en moyenne augmen-

ter la durée par 0,55% [0,3807% ; 0,7229%]. L'intensité du vent a un e�et contraire, avec une

diminution de 0,12% [-0,1301% ; -0,112%] par km/h de plus. L'e�et d'interaction est lui aussi

négatif à -0,04% [-0,047% ; -0,0235%]. Pour la température, l'e�et est similaire à celui du vent,

soit une diminution de 0,15% [-0,1549% ; -0,1475%] par degré additionnel. Donc la pluie, qui

est sans doute le facteur prépondérant dans la dé�nition d'une mauvaise température, semble

entrainer une augmentation de l'o�re de travail. Ceci est conforme avec les résultats des ré-

gressions précédentes. Les chau�eurs répondent positivement aux opportunités engendrées par

un temps pluvieux.

Dans ce qui précède, j'ai fait l'hypothèse que le mauvais temps avait un impact à la hausse

sur le salaire à travers une augmentation de la demande. Comment être certain cependant que

cette hausse n'est pas plutôt due à une diminution de l'o�re par les chau�eurs ? Il est possible

en e�et d'argumenter que les intempéries puissent diminuer le plaisir de la conduite et inciter

les chau�eurs à diminuer leur activité. Il est vrai que je viens de démontrer une relation positive

entre mauvais temps et nombre de taxis sur les routes. Par contre, cette régression a�che les

coe�cients qui sont les moins signi�catifs. Dans les paragraphes qui suivent, je tente d'explorer

cette hypothèse plus en détail. Je con�rme d'abord l'e�et sur la demande, pour ensuite me

tourner vers l'o�re.

E�et sur la demande

Pour con�rmer l'impact des conditions météorologiques sur la demande du service de taxi new-

yorkais, j'utilise mes données sous la forme d'une observation par course et procède avec une

régression de la distance parcourue par course sur mes variables météorologiques. Je contrôle

également pour le temps.

L'idée justi�ant cette régression s'illustre de la manière suivante. On imagine un individu qui

doit se déplacer sur une distance relativement courte, peut-être quelques pâtés de maisons.

A�n de se rendre à sa destination, cet individu a un choix à faire entre les di�érents modes

de transport qui s'o�rent à lui. Lors d'une journée ensoleillée, il choisira vraisemblablement

l'option la moins coûteuse, soit la marche. Lors d'une journée pluvieuse cependant, cette

option lui semblera moins attrayante. Il est ainsi plus probable qu'il opte pour un autre mode

de déplacement, par exemple les services d'un taxi. Du point de vue du chau�eur, toutes choses

étant égales par ailleurs, cela équivaut à e�ectuer une course supplémentaire pour laquelle la

distance est vraisemblablement inférieure à la moyenne. Ainsi, lors d'une journée pluvieuse,

la distance moyenne e�ectuée lors d'une course devrait diminuer. Si le mauvais temps a l'e�et

que je lui suppose, je devrais donc observer une relation négative dans cette régression.

Sans trop de surprises, tous les coe�cients d'intérêt sont négatifs. Pour chaque millimètre

25

Table4.1�

Réactions

dumarchédestaxisau

mauvaistemps.Régressions

parMCO

(sanscontrôles)

Régression

Sanscontrôles

Pluieen

mm

Vent(k/h)

Tem

p.(°F)

Interaction

(1)LnSalairehoraire

0.0073

***

0.0021

***

0.0005

***

-0.0002***

(0.0001)

(0.00001)

(0.000004)

(0.00001)

[.007043;.007625]

[.002073;.002124]

[.000484;.000501]

[-.000242;-.000195]

(2)LnTem

pspasséavec

unclient

parheure(m

in.)

0.0233

***

0.0058

***

0.0018

***

-0.0007***

(0.00017)

(0.00001)

(0.000005)

(0.00001)

[.022973;.023622]

[.005732;.005787]

[.001829;.001847]

[-.000744;-.000692]

(3)LnDistanceavec

unclient

parheure(km)

-0.0049***

-0.0008***

-0.0003***

0.0003

***

(0.0002)

(0.00002)

(0.000006)

(0.00002)

[-.005278;-.004502]

[-.000803;-.000737]

[-.000279;-.000257]

[-.002728;-.001959]

(4)LnNom

brede

courses

e�ectuéesparheure

0.0043

***

0.0057

***

-0.0017***

0.0002

***

(0.0003)

(0.00003)

(0.000009)

(0.00003)

[.003601;.004963]

[.005657;.005769]

[-.001678

;-.001642]

[.000106;.000219]

(5)LnNom

brede

taxisavec

unclient

surlesroutes

parheure

0.0426

***

0.0134

***

0.0038

***

-0.0036***

(0.0122)

(0.001)

(0.0003)

(0.001)

[.023708;.061567]

[.011558;.015234]

[.003219;.004436]

[-.005404;-.001837]

(6)LnDurée

duquartde

travail

0.0079

***

-0.0001**

-0.00004

***

0.00009

(0.0008)

(0.00004)

(0.00001)

(0.00005)

[.005939;.009902]

[-.000248;-.000043]

[-.000065;-.000021]

[-.000045;.000229]

***signi�catifà0,1%

;**

1%;*5%

;'10%.

26

Table4.2�

Réactions

dumarchédestaxisau

mauvaistemps.Régressions

parMCO

(aveccontrôles)

Régression

Avec

contrôles

Pluie(m

m)

Vent(k/h)

Tem

p.(°F)

Interaction

(1)LnSalairehoraire

0.0051

***

0.0007

***

-0.0002***

-0.00003

*(0.00015)

(0.00001)

(0.000009)

(0.00001)

[.004826;.005407]

[.000684;.000736]

[-.000235;-.000199]

[-.000049;-.000002]

(2)LnTem

pspasséavec

unclient

parheure(m

in.)

0.0159

***

0.0021

***

0.0007

***

-0.00009

***

(0.0002)

(0.00001)

(0.00001)

(0.00001)

[.015569;.016227]

[.002054;.00211]

[.000761;.0008]

[-.000117;-.000064]

(3)LnDistanceavec

unclient

parheure(km)

-0.0023***

-0.0005***

-0.001

***

0.0001

***

(0.0002)

(0.00002)

(0.00001)

0.00002

[-.002728;-.001959]

[-.0005561

;-.000488]

[-.000998;-.000951]

[.00008

;.000143]

(4)LnNom

brede

courses

e�ectuéesparheure

0.0013

***

0.0023

***

-0.001

***

0.0009

***

(0.0003)

(0.00003)

(0.00002)

(0.00003)

[.000605;.001959]

[.002207;.002322]

[-.001076;-.000997]

[.000825;.000937]

(5)LnNom

brede

taxisavec

unclient

surlesroutes

parheure

0.0174

*0.0033

***

0.0038

***

-0.0011

(0.0087)

(0.0007)

(0.0005)

(0.0007)

[.000754;.034001]

[.001853;.004655]

[.002884;.004799]

[-.002453;-.000224]

(6)LnDurée

duquartde

travail

0.0055

***

-0.0012***

-0.0015***

-0.0004***

(0.0006)

(0.00004)

(0.00002)

(0.00005)

[.003807;.007229]

[-.001301;-.00112]

[-.001549;-.001475]

[-.00047

;-.000235]

***signi�catifà0,1%

;**

1%;*5%

;'10%

.

27

de précipitation additionnel, la distance moyenne d'une course diminue de 0,43% [-0,4604% ;

-0,4002%]. L'intensité du vent entraine une diminution de 0,167% [-0,1697% ; -0,1647%] par

km/h. L'e�et d'interaction a�che un coe�cient de -0,02% [-0,0232% ; -0,0185%]. Seul e�et

curieux, la distance moyenne diminue avec l'augmentation en température, à raison de -0,05%

[-0,0536% ; -0,0501%] par degré Fahrenheit. Tous ces résultats sont signi�catifs au seuil de

0,1%. Ainsi, il semble acceptable d'attribuer aux mauvaises conditions météorologiques un

impact positif sur la demande.

E�et sur l'o�re

Comme je l'ai mentionné précédemment, il pourrait être justi�é de croire à un e�et ambigu

du mauvais temps sur l'o�re de services de taxi. D'abord, si les chau�eurs suivent le modèle

intertemporel, on imagine facilement un e�et positif causé par une perspective de revenus plus

importants, suivant l'augmentation de la demande. D'autre part, il pourrait aussi y avoir un

e�et négatif, causé par un désagrément associé au fait de conduire sous de mauvaises conditions

météorologiques, qui n'a rien à voir avec le désir d'atteindre un objectif. Dans tous les cas,

l'e�et dominant donnera son sens à la variation de l'o�re. Comme en font foi les résultats

précédents, cet e�et semble être en moyenne davantage en faveur de l'augmentation de l'o�re.

Est-il possible cependant que l'e�et dominant soit di�érent pour certains chau�eurs ?

Si ces deux types de chau�eurs existent, je devrais observer pour certains d'entre eux une aug-

mentation du nombre de courses e�ectuées par heure. Pour les autres, je m'attends à trouver

une diminution, dans la mesure où le désagrément encouru par la conduite lors de mauvaises

conditions aurait un e�et dominant. A�n d'arriver à faire la distinction des chau�eurs selon ces

deux types, je suppose d'abord que la distribution de mes données puisse s'exprimer comme un

mélange de deux composantes gaussiennes. Je procède ensuite à l'estimation des paramètres

du mélange en utilisant un algorithme nommé Espérance-Maximisation (E-M). Le tout est

décrit dans ce qui suit 5.

Modèle de mélange gaussien Je soupçonne donc la présence de deux types de compor-

tement chez les chau�eurs. En posant l'hypothèse que ces deux groupes sont distribués nor-

malement, je peux exprimer la fonction de densité de mes données comme une combinaison

convexe, telle que

p(x|θ) = πN (xi|µ1,Σ1) + (1− π)N (xi|µ2,Σ2)

5. Cette présentation est en grande partie basée sur le document � Note Set 4 : Finite Mixture Models

and the EM Algorithm � par M. Padhraic Smyth, professeur au département d'informatique de l'université deCalifornie à Irvine

28

Où p(x|θ) désigne la vraisemblance d'observer xi ;

xi représente les observations d'un chau�eur pour une heure donnée dans l'année ;

θ = (π, µ1, µ2,Σ1,Σ2) représente l'ensemble des paramètres ;

π est l'importance du premier groupe dans la distribution ;

µk est le vecteur de moyennes pour le groupe k ;

Σk est la matrice de variance-covariance pour le groupe k.

La fonction de log-vraisemblance est donnée par

logL(Θ|X) =

N∑i=1

log[πN (xi|µ1,Σ1) + (1− π)N (xi|µ2,Σ2)

].

Normalement, il serait possible d'estimer aisément les paramètres qui maximisent une fonction

de log-vraisemblance de façon analytique en cherchant l'estimateur du maximum de vraisem-

blance (MLE)

Θ∗ = argmaxΘ

log L(Θ|X).

Cependant, l'appartenance de chaque observations quant aux di�érentes composantes de la

mixture est inconnue, ce qui rend ardue l'utilisation de l'estimateur MLE. A�n de contourner

cette di�cultée, je fait appel à l'algorithme itératif E-M, qui est souvent présenté comme la

solution aux problèmes de données manquantes.

Algorithme E-M La première étape de l'algorithme (étape E pour espérance) consiste à

calculer la probabilité a posteriori que l'observation i appartienne à chacun des types. Celle-ci

s'obtient par la règle de Bayes :

zi1 = p(k = 1|xi) =p(k = 1)p(xi|k = 1)

p(xi)=

πN (xi|µ1,Σ1)

πN (xi|µ1,Σ1) + (1− π)N (xi|µ2,Σ2).

Puisque je suppose l'existence de deux groupes seulement, zi2 = 1− zi1. Comme à la première

itération les di�érents paramètres sont inconnus, il est nécessaire d'initialiser l'algorithme avec

des valeurs arbitraires.

La seconde étape (étape M pour maximisation), consiste à réévaluer les paramètres que l'on

cherche à estimer, en pondérant chaque observation par sa probabilité d'appartenir au groupe

en question. Comme je me trouve à estimer les paramètres de densités gaussiennes, ceux-ci

sont donnés par

29

µk =

∑Ni=1 zikxi∑Ni=1 zik

Σk =

∑Ni=1 zik(xi − µk)(xi − µk)T∑N

i=1 zik

πk =1

N

N∑i=1

zik

L'algorithme alterne ensuite entre les étapes E et M jusqu'à la convergence de la log-vraisemblance.

Une fois cette convergence établie, l'information contenue dans l'estimation des matrices de

covariance nous permet d'obtenir les réactions recherchées pour chacun des groupes identi�és.

Les résultats sont rapportés dans le tableau 4.3 6.

Table 4.3 � Résultats d'un FMM à deux composantes d'une régression du nombre decourses/heure sur le mauvais temps.

Régresseurs Groupe 1 Groupe 2

Pluie 0,00265 *** 0,00033(0,00072) (0,00114)[0,001235 ; 0,004064 ] [-0,00191 ; 0,002577]

Vent 0,00111 *** 0,00237 ***(0,000065) (0,000097)[0,000983 ; 0,001238] [0,002183 ; 0,002563]

Interaction 0,00011 ' 0,00131 ***(0,00006) (0,00009)[-0,000011 ; 0,000224] [0,001128 ; 0,001489]

Température 0,00036 *** -0,00194 ***(0,00004) (0,00007)[0,000275 ; 0,000453] [-0,002068 ; -0,001805]

*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.

Contrairement à mes attentes, ceux-ci sont plutôt similaires dans les deux cas. En moyenne,

l'e�et du millimètre de pluie additionnel est une augmentation du nombre de courses e�ec-

tuées par heure de 0,26% [0,124% ; 0,41%] pour le premier type de chau�eur et de 0,03%

[-0,19% ; 0,26%] pour le second. Cependant, le coe�cient estimé pour le second groupe n'est

pas signi�catif. Le vent augmente quant à lui le nombre de courses par heure moyen de 0,11%

[0,098% ; 0,124%] et 0,237% [0,218% ; 0,256%], pour le premier et deuxième groupe respecti-

vement. Les e�ets d'interaction sont positifs à 0,01% [-0,0011% ; 0,023%] et 0,13% [0,113% ;

6. Le terme FMM fait référence à �nite mixture models, qu'il serait possible de traduire librement par� modèle de combinaison �ni de densités �.

30

0,149%], mais seulement celui du second groupe semble signi�catif. En�n, la di�érence la plus

notable provient de l'e�et de la température. Pour les chau�eurs du premier groupe, un °F

supplémentaire entraine une augmentation de 0,036% [0,028% ; 0,045%], alors qu'il entraine

pour le second groupe une diminution de 0,19% [-0,207% ; -0,181%]. Contrairement à ce que

j'ai prédit, aucun des deux groupes de chau�eurs ne semble diminuer le nombre de courses

e�ectuées lors d'intempéries. Pour le moment, il ne semble donc pas y avoir de groupe pour

lequel l'e�et de désagrément soit dominant.

A�n de m'en convaincre davantage, je procède par la même méthode pour analyser l'impact

du mauvais temps sur la durée moyenne du quart de travail. Si les deux types de chau�eurs

coexistent dans mes données, une partie d'entre eux sera incitée à travailler plus longtemps.

Les autres, au contraire, désireront arrêter plus tôt. Le mauvais temps aura ainsi un impact

opposé chez les deux groupes. Je rapporte les résultats de cette régression dans le tableau 4.4.

Table 4.4 � Résultats d'un FMM à deux composantes d'une régression du nombre d'heurestravaillées sur le mauvais temps


Pluie 0,0094 ** 0,000416(0,00352) (0,00043)[0,002481 ; 0,01627 ] [-0,000429 ; 0,00126]

Vent -0,0099 *** -0,0001 ***(0,00023) (0,00003)[-0,010402 ; -0,009498] [-0,000156 ; -0,000052]

Interaction -0,0012 *** 0,00001(0,00027) (0,00003)[-0,001757 ; -0,000703] [-0,000053 ; 0,000068]

Température -0,009 *** -0,00032 ***(0,00012) (0,00001)[-0,00928 ; -0,008801] [-0,000347 ; -0,0003]

*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.

Ici aussi, les résultats rapportés sont plutôt similaires pour les deux groupes identi�és. L'e�et

relatif aux précipitations est positif dans les deux cas avec une augmentation de 0,94% [0,25% ;

1,63%] pour le premier groupe et une autre de 0,04% [-0,0429% ; 0,126%] pour le second.

Toutefois, le coe�cient du second groupe identi�é n'est pas signi�catif. L'augmentation dans

l'intensité du vent entraine une diminution des heures travaillées de 0,99% [-1,04% ; -0,949%]

pour les chau�eurs du premier groupe et une diminution de 0,01% [-0,016% ; -0,0052%] pour

ceux du second. La seule divergence se trouve au niveau de l'e�et d'interaction, avec un

coe�cient de -0,12% [-0,176% ; -0,07%] pour le premier groupe et un autre de 0,001% [-0,005% ;

0,007%] pour le second, qui n'est cependant pas signi�catif. En�n, les deux groupes réagissent

en moyenne par une diminution des heures travaillées suite au °F de température additionnel,

31

en raison de -0,9% [-0,93% ; -0,88%] pour les chau�eurs du premier groupe et de -0,032% [-

0,035% ; -0,03%]. Dans l'ensemble, les résultats sont également très semblables à ceux trouvés

par la même régression faite sur l'ensemble des chau�eurs (tableau 4.2, rangée 6). Encore une

fois, comme la pluie est sans doute le facteur prépondérant en terme de mauvais temps et

qu'elle entraine une augmentation signi�cative des heures travaillées pour le premier groupe,

ces chau�eurs semblent avoir un comportement en accord avec le modèle intertemporel.

Pour ce qui est du second groupe, la conclusion est moins claire. Parce que la réaction face

au vent est négative, on peut être porté à y voir un désagrément causé par le mauvais temps.

Ceci dit, cet e�et est plutôt faible. De plus, le fait que le coe�cient relatif aux précipitations

ne soit pas signi�catif enlève beaucoup de force à cette conclusion. Je note également au

passage qu'il ne semble pas plus y avoir d'arguments solides en faveur d'un comportement

reference-dependent.

Ainsi, aucun groupe de chau�eur ne semble signi�cativement sou�rir d'un e�et de désagrément

dominant. Ce pourrait-il alors que les mauvaises conditions météorologiques a�ectent leur

comportement d'une autre manière ? Pour explorer cette avenue, j'observe l'e�et qu'ont ces

variables sur la distance par heure parcourue avec un client à bord. Les résultats se retrouvent

dans le tableau 4.5.

Table 4.5 � Résultats d'un FMM à deux composantes d'une régression de la distance/heuresur le mauvais temps


Pluie 0,00673 *** -0,0054 ***(0,0007) (0,00019)[0,005347 ; 0,008117] [-0,005785 ; -0,00508]

Vent 0,00062 *** -0,001 ***(0,00006) (0,000016)[0,000504 ; 0,000737] [-0,001059 ; -0,000995]

Interaction -0,00029 *** 0,0002 ***(0,00006) (0,000015)[-0,000412 ; -0,00018] [0,00017 ; 0,00023]

Température -0,00046 *** -0,00118 ***(0,00004) (0,000011)[-0,000543 ; -0,000382] [-0,0012 ; -0,001155]

*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.

Cette fois-ci, j'arrive à distinguer clairement deux types de comportements. Pour le premier

groupe identi�é par l'algorithme, la réponse est positive. C'est-à-dire que les chau�eurs de ce

groupe augmentent en moyenne la distance parcourue en une heure par 0,67% [0,53% ; 0,81%]

pour chaque millimètre de précipitation supplémentaire. La distance moyenne est accrue de

32

0,062% [0,05% ; 0,074%] suite à l'augmentation d'un km/h d'intensité du vent. L'e�et d'in-

teraction est négatif à -0,03% [-0,04% ; -0,02%]. En�n, chaque °F additionnel entraine une

diminution de 0,05% [-0,054% ; -0,038%] dans la distance parcourue.

Les réponses du second groupe de chau�eur sont contraires à celles du premier. Ceux-ci ré-

agissent en moyenne par une diminution de 0,54% [-0,58% ; -0,5%] dans la distance par heure

pour chaque millimètre de pluie. Même réaction face au vent, avec une diminution de 0,1%

[-0,106% ; -0,0995%] par km/h. Pour ces chau�eurs cependant, l'e�et d'interaction est positif à

0,02% [0,017% ; 0,023%]. L'augmentation de température d'un °F est suivie d'une diminution

de 0,118% [-0,12% ; -0,116] de la distance parcourue par heure.

On peut trouver deux sources d'explications à cette di�érence. D'un côté, comme les chau�eurs

du second groupe a�chent une diminution dans la distance moyenne parcourue , mais pas dans

le nombre de courses e�ectuées, il se peut que ceux-ci soient simplement plus prudents dans

leur conduite. Alternativement, il est possible que le mauvais temps mette en évidence une

spécialisation chez les chau�eurs. Par exemple, certains d'entre eux pourraient chercher à se

limiter à des courses plus courtes, mais plus nombreuses, situées dans le centre-ville. Quant

au reste, les courses plus longues mais également plus payantes de la banlieue et des aéroports

a�cheront un intérêt supérieur.

Dans l'ensemble, ce qui ressort de cette analyse de l'hétérogénéité du comportement est que

les chau�eurs ne se laissent pas décourager par le mauvais temps. Aucun argument solide en

faveur du modèle reference-dependent n'a été identi�é. Le modèle intertemporel sort vainqueur

de cette manche.

4.3 Estimation d'élasticités

Je passe maintenant à l'étape suivante de mon mémoire, soit l'estimation d'élasticités salaire

de l'o�re de travail. En temps normal, pour obtenir une élasticité, il me su�rait d'utiliser mes

données sous leur forme où une observation représente un quart de travail et de régresser le

log du nombre d'heures travaillées sur le log du salaire horaire. Par contre, en procédant ainsi,

je m'expose à un problème d'endogénéité.

Formellement, le modèle que je tente d'estimer est le suivant

y = β0 + β1x1 + . . .+ βkxk + e

33

Où x1 =riyi

est le salaire horaire ;

y est le nombre d'heures travaillées ;

r est le revenu total du quart de travail ;

xk(k ∈ {2, . . . ,K}) sont mes variables de contrôle pour le temps, soit des régresseurs exogènes ;

e est le terme d'erreur.

On dit d'un régresseur qu'il est endogène si celui-ci est corrélé avec le terme d'erreur, de telle

sorte que

E[ei|xi] = ηi 6= 0.

L'endogénéité est causée par la façon dont je dé�nis le salaire horaire. Comme celui-ci est

fonction du nombre d'heures travaillées et que ce nombre dépend lui-même du terme d'erreur,

la corrélation est évidente. Par cette dernière, l'une des hypothèses sur lesquelles se base

le modèle de régression linéaire se trouve être violée. Cela a pour conséquence directe que

l'estimation du vecteur de paramètre β par la méthode des MCO donnera un résultat biaisé

E[βMCO|X] = β + (X′X)−1X′η 6= β,

X étant la matrice de régresseurs. Qui plus est, il existe une autre source potentielle de

corrélation entre le terme d'erreur et le salaire horaire, soit l'omission de variable. Le nombre

d'heures travaillées est un choix fait par le chau�eur. Comme toutes décisions humaines, celle-

ci sera vraisemblablement in�uencée par une myriade de facteurs, dont le modèle ne peut

prétendre faire la liste exhaustive. On peut penser par exemple au fait d'avoir une jeune

famille, au niveau de motivation du chau�eur, son âge ou encore sa santé physique. Ces

variables, évidemment corrélées avec la durée du quart de travail, le sont également avec le

salaire horaire, par dé�nition. Par contre, comme elles ne sont pas disponibles, je dois les

omettre et considérer qu'elles font partie du terme d'erreur. Encore une fois, l'estimation d'un

tel modèle donnera un estimateur β inconsistant.

A�n de remédier à ces problèmes, je dois faire appel aux méthodes d'estimation par variables

instrumentales.

Méthode d'estimation par variables instrumentales 7

Une variable instrumentale (ou instrument), souvent dénotée par la lettre z, possède la pro-

priété de n'a�ecter directement que le régresseur soufrant d'endogénéité. Ainsi, un instrument

valide doit se trouver à l'extérieur du modèle initial et respecter les conditions

7. Cette section s'inspire fortement de l'ouvrage de Cameron et Trivedi(2005). Elle se base également surGreen(2011) et le �chier d'aide du package ivreg2 de Stata.

34

Corr(x1, z) 6= 0 et Corr(z, e) = 0.

Avec un ensemble de variables qui respecte ces deux propriétés, il me serait possible de purger

les variations du salaire horaire de leur partie liée au terme d'erreur. Pour se faire, il su�t dans

une première étape de régresser le salaire horaire sur l'ensemble des instruments. Comme ces

derniers ne sont pas corrélés avec le terme d'erreur, il s'en suit que les valeurs ainsi prédites

du salaire horaire seront (asymptotiquement) exogènes. Par la suite, en utilisant ces valeurs

prédites pour remplacer le salaire horaire endogène dans le modèle initial, j'obtiendrai par

régression MCO l'e�et recherché d'une variation du salaire horaire sur le nombre d'heures

travaillées. Si l'ensemble d'instruments n'en contient qu'un seul, on parlera alors de l'estimateur

par Variable Instrumentale (VI). Si l'ensemble contient plusieurs instruments, on parle alors

de l'estimateur par Moindres Carrés à Deux Étapes (MC2E). C'est ce dernier que j'utilise

pour mon analyse et il peut se résumer par l'équation suivante

βMC2E =

[X′Z(Z′Z)−1Z′X

][X′Z(Z′Z)−1Z′y

].

Il peut être démontré que l'estimateur par MC2E est asymptotiquement distribué selon une

loi normale de variance

V (βMC2E) = s2[X′Z(Z′Z)−1Z′X]−1,

où la variance du terme d'erreur est calculée avec les régresseurs du modèle initial

s2 =1

n

n∑i=1

(yi − x′iβMC2E)2.

Les instruments que je retiens sont les moyennes des précipitations de pluie ainsi que la vitesse

du vent durant le quart de travail. Avant de s'intéresser aux résultats d'une telle estimation,

il serait de bon ton de chercher à véri�er les deux conditions relatives aux instruments.

La condition de corrélation entre le salaire horaire et mes deux instruments peut se véri�er à

l'aide de la première étape de l'estimation par MC2E. Le tableau 4.6 rapporte les résultats de

celle-ci, pour trois spéci�cations di�érentes. La première est la plus simple possible. La seconde

contient en plus des contrôles pour le temps. La troisième considère en plus la présence d'e�ets

�xes chez les chau�eurs. Comme j'obtiens que l'e�et de la pluie et du vent sont signi�catifs

et ce peu importe la spéci�cation (même en étant attentif au problème de la p-value), il s'en

suit que cette condition est respectée.

35

Table 4.6 � Résultats de la première étape des régressions par MC2E

Spéci�cation(1) (2) (3)

Pluie0,0113356 *** 0,0103021 *** 0,0092649 ***(0,0001692) (0,0001732) (0,0001504)

[0,0110039 ; 0,0116672] [0,0099627 ; 0,0106415] [0,0089701 ; 0,0095597]

Vent0,0012551 *** 0,0005292 *** 0,0006177 ***(0,0000231) (0,0000263) (0,0000233)

[0,0012099 ; 0,0013003] [0,0004777 ; 0,0005807] [0,0005721 ; 0,0006633]

Contrôles Non Oui OuiE�ets �xes Non Non Oui*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.

Pour ce qui est de la seconde condition, qui stipule que l'instrument doit être exogène, la

véri�cation est légèrement plus complexe. Si le modèle à estimer est � exactement identi�é �,

c'est-à-dire que le nombre d'instruments est égal au nombre de variables à instrumenter, la

véri�cation n'est pas possible. Heureusement, dans le cas d'un modèle suridenti�é comme le

mien, il est possible de faire appel au test de Sargan-Hansen. L'intuition derrière ce test est la

suivante. Dans un premier temps, on utilise l'ensemble des instruments retenus pour estimer

le modèle par MC2E. Avec le résultat de cette estimation, on obtient les résidus

e = y −X′βMC2E.

On projette ensuite ces résidus sur l'ensemble des instruments utilisés dans l'estimation pré-

cédente, tel que

e = Zδ + υ,

où υ est un autre terme d'erreur. À cette régression est associé un R2, avec lequel on crée la

statistique de test égale à N × R2, qui suit une loi de Khi-deux dont le degré de liberté est

donné par la di�érence entre le nombre d'instruments et le nombre de variables instrumentées.

L'hypothèse nulle de ce test est que l'ensemble des instruments utilisés n'est pas corrélé avec

le terme d'erreur. Ainsi, le rejet de cette hypothèse fait apparaître un doute sur la validité des

instruments.

À la manière dont est calculée cette statistique, il est évident que l'utilisation d'un grand

échantillon donnera une valeur élevée, ce qui augmente la probabilité de rejet. En soi, il est

cependant clair que la taille des données n'a aucun lien avec la validité réelle d'un instrument.

36

A�n d'essayer de contourner (et illustrer) ce problème, je procède par une simple méthode

de rééchantillonnage. Je tire 1000 sous échantillons de 0,5%, 1%, 5%, 20% et 30% de mes

données. Pour chacun des sous-échantillons, j'estime ensuite le modèle par MC2E a�n de

pouvoir observer la statistique du test de Sargan-Hansen et la probabilité de rejet qui lui est

associée.

Pour les 1 000 sous échantillons de taille 0,5%, le test rejette la validité de l'ensemble des

instruments 7,4% du temps au seuil de 5%. En moyenne, la p-value du test est de 49,66%

et l'élasticité salaire estimée est de 71,07%. Pour des sous-échantillons de taille 1%, le rejet

s'e�ectue 8,8% du temps. La p-value moyenne est de 45,63% et l'élasticité de 73,34%. Lorsque

la taille des sous-échantillons est augmentée à 5%, le test rejette la validité 43% du temps,

toujours pour le même seuil. Pour cette taille de sous-échantillon, la moyenne de la p-value est

à 17,24% et l'élasticité estimée moyenne reste assez stable à 71,04%. Avec des tailles de 20%

et 30%, j'observe un rejet 98,1% et 99,9% du temps respectivement. En moyenne, la validité

est rejetée dans les deux cas, à des p-value de 0,5% et 0,027%. Quant aux élasticités salaires

moyennes, celles-ci restent toujours stables à 70,69% et 70,86% respectivement.

Comme avec de faibles pourcentages de taille d'échantillon je conserve toujours un nombre

acceptable de données pour faire de l'inférence statistique, et qu'à ces pourcentages le test

de Sargan-Hansen ne semble pas rejeter l'hypothèse nulle de validité, j'en conclus que les

moyennes de pluie et de vent sont des instruments valides 8.

Résultats

Je présente maintenant dans le tableau 4.7 les élasticités estimées par la méthode MC2E faite

sur l'échantillon totale.

Table 4.7 � Élasticitées estimées par MC2E

Spéci�cation(1) (2) (3)

Élasticitée salaire0,4347554 *** 0,5724568 *** 0,4841766 ***(0,0235398) (0,031018) (0,027734)

[0,3886183 ; 0,4808926] [0,5116626 ; 0,6332509] [0,429819 ; 0,5385342]

Contrôles Non Oui OuiE�ets �xes Non Non Oui

*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.

Je constate qu'avec la spéci�cation la plus simple possible, l'élasticité estimée est substantiel-

lement positive et fortement signi�cative. Sous cette spéci�cation, une augmentation tempo-

raire du salaire horaire de 1% entrainerait une augmentation de 0,43% [0,39% ; 0,48%] dans

le nombre d'heures travaillées. En ajoutant des contrôles pour le temps au modèle estimé,

8. 0,5% de mon échantillon total donne plus de 35 000 observations.

37

l'élasticité devient plus forte et a�che une augmentation de l'ordre de 0,57% [0,51% ; 0,63%].

Si je prends en plus en compte de la présence d'e�ets �xes chez les chau�eurs, l'augmentation

du nombre d'heures travaillées retombe à 0,48% [0,43% ; 0,54%].

Dans l'ensemble les résultats sont en accord avec le modèle intertemporel et ne sont pas très

éloignés des estimations de Farber (2015). Ceci est particulièrement le cas pour la spéci�cation

avec contrôles et sans e�ets �xes. Ainsi, il s'agit encore une fois d'un argument en faveur de

ce modèle.

Il semble également clair que le choix des instruments peut avoir un impact important sur

le résultat de telles estimations. En e�et, Camerer, Babcock, Loewstein et Thaler (1997),

en utilisent comme instrument les 25e, 50e et 75e percentiles de la distribution du salaire

des autres chau�eurs, obtiennent des élasticités qui sont clairement négatives. Même chose

pour Chou (2002), qui se sert du salaire moyen des autres chau�eurs. J'attribue cependant

les élasticités négatives estimées dans ces articles à un mauvais choix d'instrument. D'abord

parce que, dans le premier cas, peu d'e�orts ont été placés dans la véri�cation des conditions de

validité des instruments 9. Ensuite, il me semble intuitivement fort probable que la distribution

des salaires puisse être a�ectée par un facteur inobservé, par exemple une convention ou un

évènement quelconque. À l'inverse, les conditions météorologiques y sont vraisemblablement

moins sensibles.

4.4 Modèle de choix discret 10

Comme le démontre Farber(2005), la méthode économétrique utilisée pour identi�er le modèle

pertinent peut avoir un impact important sur les conclusions �nales. Ainsi, bien que les résul-

tats des estimations précédentes accordent généralement la victoire au modèle intertemporel,

je désire complété mon analyse par l'estimation d'un modèle en choix discret. Suivant Farber

(2005, 2008 et 2015) ainsi que Crawford et Meng (2011), il est possible de voir la complétion

de chaque course e�ectuée par un chau�eur comme étant un point de décision pour celui-ci.

À ce moment, le chau�eur peut choisir entre arrêter pour la journée ou faire encore une autre

course. Ainsi cette décision, dénotée ici yi, est telle que

yi =

{1 si le chau�eur arrête.

0 si le chau�eur continu.

La probabilité p que le chau�eur prenne la décision d'arrêter de travailler est dé�nie comme

9. Comme les travaux de Sargan et de Hansen qui ont mené au test utilisé plus tôt ont paru plus de 10 ansavant l'article de Camerer et coll. (1997), et vu la relativement petite taille des échantillons utilisés, il auraitété tout à fait possible de le faire.10. Encore une fois grandement inspiré de Cameron et Trivedi (2005).

38

pi ≡ Pr[yi = 1|x] = F (x′iβ).

où F (x′β) est une fonction qui dépend d'un vecteur de régresseurs X incluant le nombre

d'heures travaillées depuis le début du quart de travail, le montant accumulé lors de celui-ci,

le cumulatif des distances parcourues avec un client à bord ainsi que le nombre de courses

e�ectuées. À ces variables, j'en ajoute une autre rapportant le salaire horaire touché par le

chau�eur pour les cinq dernières courses qui ont été e�ectuées dans l'heure qui précédent la

prise de décision. Cette variable a pour but de capter l'e�et du � momentum �observé par le

chau�eur. En�n, les contrôles habituels sont également inclus.

Ici encore, les deux modèles de comportement ont des prédictions très di�érentes quant aux

résultats de cette estimation. Pour un chau�eur ayant un comportement � intertemporel �,

la décision d'arrêter de travailler devrait surtout être in�uencée positivement par le nombre

d'heures qu'il a travaillé depuis le début de son quart de travail. De plus, l'importance du

montant accumulé ne devrait pas l'inciter à retourner chez lui. Au contraire même, elle devrait

l'encourager à continuer. Ainsi, si la majorité des chau�eurs sont � intertemporel �, je devrais

obtenir des e�ets marginaux estimés pour le nombre d'heures travaillées et le montant accumulé

qui sont respectivement négatifs et positifs.

Dans le cas contraire, pour un chau�eur ayant pour objectif d'atteindre un certain revenu, la

décision sera in�uencée de manière positive par le montant accumulé, et moins fortement par

le nombre d'heures qui ont été travaillées. Donc, pour un tel type de comportement, l'e�et

marginal estimé relatif au montant cumulatif devra être clairement positif.

Le choix de la fonction F (x′β) déterminera le type de modele de choix discret à utiliser.

Additive random utility models/ modèle Probit

Le type de modèle où un individu doit faire un choix entre deux alternative selon celle qui

lui apporte un plus grand niveau de satisfaction est quali�é de Modèle d'Utilité Aléatoire

(Random Utility Model). Une version additive de ce type de modèle spéci�era des fonction

d'utilités pour les deux alternatives qui ont la forme suivante

U0 = V0 + ε0,

U1 = V1 + ε1,

où V0 et V1 sont les parties déterministes de l'utilité et où ε0 et ε1 sont les parties aléatoires.

Comme l'alternative qui donne un plus grand niveau de satisfaction est choisie, y = 1 sera

observée si U1 > U0. Comme on considère la présence d'une partie aléatoire dans l'utilité, le

choix de l'individu est un évènement aléatoire avec probabilité

39

Pr[y = 1] = Pr[U1 > U0]

= Pr[V1 + ε1 > V0 + ε0]

= Pr[ε0 − ε1 < V1 − V0]

= F (V1 − V0).

La fonction F s'interprète comme étant la fonction de densité cumulée de (ε0 − ε1). Si on

suppose que ε0 et ε1 suivent toutes deux une loi normale et que l'on normalise leur di�érence,

il en découle directement que la fonction F est la densité cumulée de la loi normale standardisée

Φ(x′β) =

∫ x′β

−∞

1√2πe−z

2/2dz.

Cette fonction est celle utilisée par l'estimation d'un modèle probit.

L'estimation des paramètres se fait par maximum de vraisemblance sur une distribution de Ber-

noulli (comme la variable y n'a que deux instances possibles). La fonction de log-vraisemblance

prend donc la forme suivante :

logL =N∑i=1

[yi logΦ(x′β) + (1− yi) log (1− Φ(x′β))

].

Une fois les paramètres obtenus, il su�t de dériver la fonction de densité cumulée par l'une de

ses variables pour connaître l'impact de sa variation sur la probabilité qu'un chau�eur décide

d'arrêter de travailler

∂Φ(x′β)

∂x= φ(x′β)β.

Les résultats

En raison de contraintes calculatoires, j'ai dû séparer l'estimation de mon modèle probit sur

la base de chaque mois de l'année. Les principaux résultats d'intérêt, soit les e�ets marginaux

moyens relatifs à l'augmentation du montant cumulatif et du temps écoulé depuis le début du

quart de travail, sont rapportés dans le tableau .20. Ceux-ci semblent, encore une fois, être en

faveur du modèle intertemporel.

La première constatation que je fais à partir de ces résultats est que l'importance du montant

cumulé lors du quart de travail semble inciter les chau�eurs à repousser dans le temps leur

décision d'arrêter de travailler. En e�et, pour chacun des mois, l'e�et marginal moyen de

cette variable est négatif. En décembre, celui-ci est à son plus fort, avec une diminution de la

40

probabilité d'arrêt de -0,1615% [-0,1665% ; -0,1564%] pour chaque 10$ supplémentaire. C'est

au mois de mai que l'e�et est à son plus faible, en a�chant une diminution de -0,0241% [-

0,0283% ; 0,02%] pour chaque 10$ de plus. Bien que cet e�et puisse sembler faible, il n'est

jamais positif, comme le prédit un comportement d'atteinte d'objectif.

En ce qui a trait à l'e�et du temps écoulé depuis le début du quart de travail, celui-ci semble

plutôt constant à travers les mois. Il est, sans grande surprise, toujours positif. L'e�et est à

son plus fort au mois d'août, avec une augmentation de la probabilité d'arrêt d'en moyenne

1,363% [1,35% ; 1,37%] pour une heure de travail supplémentaire. Il est à son plus faible en

février, avec une augmentation de 1,23% [1,227% ; 1,2398%] par heure additionnelle.

Curieusement, le salaire horaire des cinq dernières courses dans l'heure précédent la décision du

chau�eur ne semble pas avoir d'in�uence signi�cative sur celle-ci 11. Les résultats rapportent un

e�et marginal signi�catif (au seuil de 5%) pour les mois de janvier et de juillet, mais considérant

la grande taille de l'échantillon utilisé et le problème de p-value que celle-ci entraine, très

peu de foi peu être accordée à ces résultats. Qui plus est, l'e�et estimé varie de signe, et est

tellement faible qu'il devient pratiquement insigni�ant. À toutes �ns sensibles et contrairement

à l'intuition que l'on pourrait en avoir, cette variable ne semble avoir aucune in�uence sur la

décision d'arrêt.

De même, les variables de température, au moment où le chau�eur prend sa décision, ne

semblent pas avoir d'e�ets clairs. Ceci est particulièrement curieux pour la pluie, pour laquelle

je m'attendais à trouver un e�et marginal positif. Pour ces variables aussi, le signe varie d'un

mois à l'autre.

Ceci étant dit, toute estimation d'un modèle économétrique n'est que rarement parfaite. La

présente estimation, ainsi que toutes les autres régressions de mon mémoire, ne font pas exep-

tion. En e�et, plusieurs autre e�ets d'intéraction auraient pu être considérées. Un exemple

simple pourrait être celle du nombre d'heures travaillées avec la journée de la semaine. Malheu-

reusement, comme je l'ai mentionné plus tôt, l'utilisation d'une si importante base de données

impose au chercheur de devoir faire certains choix en ce qui a trait aux paramètres estimés et

aux méthodes utilisées. D'autre facteurs, ceux-ci inobservés dans les données, pourraient avoir

un pouvoir explicatif sur la décision des chau�eurs. Par exemple, le comportement des clients

lors des courses, ou encore la destination de la dernière course e�ectuée 12. La considération

de ces di�érentes di�cultées pourrait potentiellement ammener des changements quant aux

e�ets estimés.

En ce qui a trait à l'e�et du jour de la semaine, il semble que les jeudi, vendredi et samedi

(évalués relativement au dimanche) a�chent des e�ets négatifs sur la probabilité d'arrêter de

11. Les résultats pour chaque mois sont présentés dans l'annexe.12. Crawford et Meng (2011) trouvent des e�ets signi�catifs positifs pour l'arrondissement de Brooklyn et

les aéroport Kennedy et LaGuardia

41

travailler. On peut chercher une explication à ces e�ets en argumentant une activité écono-

mique et sociale (achats de consommations, sorties, ...) plus forte lors de ces journées. Celle-ci

entraine à son tour une demande plus forte pour les services de taxi et les chau�eurs y ré-

pondent en conséquence. Toutefois, dans la mesure où il s'agit de quelquechose de prévisible,

la réaction des chau�eurs s'explique par les deux modèles ici opposés. Il ne s'agit donc pas

d'un argument en faveur de l'un d'eux.

En�n, contrairement à mes attentes, les fêtes incluses dans mon estimation n'ont pas, en

général, d'e�et important. Notamment, je prévoyais observer un e�et substantiel pour la Saint-

Valentin, qui n'a�che qu'une diminution dans la probabilité d'arrêt de -0,11% [-0,17% ; -

0,05%]. En fait, seules les fêtes de Noël, de la veille du Nouvel An et du Nouvel An a�chent

des e�ets qui sont suppérieur à 1%. Respectivement, ces e�ets sont de 1,46% [1,36% ; 1,56%],

1,38% [1,31% ; 1,46%] et 1,26% [1,19% ; 1,34%].

42

Table 4.8 � E�ets marginaux moyen d'une estimation probit, par mois, de la probabilitéd'arrêter de travailler à la �n d'une course

Mois Montant cumulé ($) Temps Cumulé (h) Pseudo R2

Janvier -0,0000847 *** 0,0130354 *** 0,2052(2,57e-06) (0,0000355)[-0,0000897 ; -0,0000796] [0,0129657 ; 0,013105]

Février -0,0000734 *** 0,0123272 *** 0,2128(2,47e-06) (0,0000363)[-0,0000783 ; -0,0000686] [0,012256 ; 0,0123984]

Mars -0,0000741 *** 0,0127671 *** 0,2124(2,32e-06) (0,0000346)[-0,0000787 ; -0,0000696] [0,0126992 ; 0,0128349]

Avril -0,0000693 *** 0,0128709 *** 0,2210(2,27e-06) (0,0000357)[-0,0000737 ; -0,0000648] [0,012801 ; 0,0129408]

Mai -0,0000241 *** 0,013085 *** 0,2249(2,14e-06) (0,0000369)[-0,0000283 ; -0,00002] [0,0130127 ; 0,0131573]

Juin -0,0000805 *** 0,0132294 *** 0,2197(2,57e-06) (0,000038)[-0,0000856 ; -0,0000755] [0,0131549 ; 0,0133039]

Juillet -0,000097 *** 0,0129531 *** 0,2124(2,75e-06) (0,0000375)[-0,0001024 ; -0,0000916] [0,0128796 ; 0,0130265]

Août -0,0000903 *** 0,0136269 *** 0,2058(3,06e-06) (0,0000404)[-0,0000963 ; -0,0000843] [0,0135476 ; 0,0137061]

Septembre -0,0000963 *** 0,0131787 *** 0,2191(2,52e-06) (0,0000375)[-0,0001012 ; -0,0000914] [0,0131051 ; 0,0132522]

Octobre -0,0000966 *** 0,0130487 *** 0,2239(2,48e-06) (0,0000362)[-0,0001015 ; -0,0000918] [0,0129777 ; 0,0131196]

Novembre -0,0001312 *** 0,0129984 *** 0,2078(2,56e-06) (0,0000375)[-0,0001363 ; -0,0001262] [0,0129249 ; 0,0130718]

Décembre -0,0001615 *** 0,0134362 *** 0,2018(2,57e-06) (0,0000377)[-0,0001665 ; -0,0001564] [0,0133623 ; 0,0135102]

*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.

43

Conclusion

Pour résumer, ce travail démontre que le modèle de comportement avec préférences du type

reference-dependent ne semble pas adéquat pour expliquer le comportement d'un chau�eur

de taxi. En e�et, en analysant comment répond le marché à un épisode de mauvais temps,

j'ai constaté une augmentation de l'o�re de travail. Même en explorant pour une possible

hétérogénéité dans le comportement, aucun indice clairement en faveur de ce modèle n'a été

trouvé. Cette conclusion est d'ailleurs renforcée par l'utilisation de méthodes di�érentes. En

procédant par une estimation avec variables instrumentales, les résultats démontrent encore

une claire augmentation de l'o�re. En�n, en cherchant à évaluer les facteurs qui peuvent in-

�uencer la décision d'un chau�eur à arrêter de travailler, je constate un e�et négatif associé au

montant d'argent accumulé lors du quart de travail. En somme, toutes les méthodes économé-

triques utilisées donnent raison au modèle intertemporel. Je rejoins donc Farber (2015) dans

ses conclusions. D'ailleurs, mon étude me laisse croire que les élasticités négatives obtenues par

les auteurs qui m'ont précédé, notamment par Camerer et col (1997) et par Chou (2002), sont

plutôt causées par un mauvais choix d'instrument, ce qui aurait ampli�é le biais d'estimation

négatif.

Ceci étant dit, comme je l'ai mentionné lors de la présentation des modèles, l'intervalle de

salaire pour lequel le modèle reference-dependent peut être pertinent est relativement restreint.

Il est possible que les variations de salaire qui ont été observées tombent dans les � zones

intertemporelles �du modèle. Par conséquent, il reste une possibilité que les chau�eurs suivent

le modèle alternatif, mais sur un intervalle si court que je ne l'ai pas détecté.

Évidemment, les conclusions de ce travail ne s'appliquent qu'aux chau�eurs de taxi et il serait

hasardeux de généraliser à tous les travailleurs. En e�et, ce groupe de travailleurs est composé

de gens qui ont fait le choix de leur profession et qui sont potentiellement plus enclins au

travail que d'autres. De plus, il est possible que ces mêmes personnes a�chent une aversion

à la perte relativement faible. Malheureusement, les données retenues ne permettaient pas de

déterminer le niveau d'aversion des individus.

D'autres études ont été menées sur des groupes di�érents, et donnent plutôt raison à des

modèles avec préférences de type reference-dependent.

44

Bibliographie

TLC Trip Record Data, nov 2016. URL http://www.nyc.gov/html/tlc/html/about/trip_

record_data.shtml.

NEWA Hourly Weather Data Page, nov 2016. URL http://www.newa.cornell.edu/index.

php?page=hourly-weather.

Baum, C. F., M. E. Scha�er et S. Stillman. ivreg2 : Stata module for extended ins-

trumental variables/2SLS, GMM and AC/HAC, LIML and k-class regression, 2010.

http ://ideas.repec.org/c/boc/bocode/s425401.html.

Camerer, C., L. Babcock, G. Loewenstein et R. Thaler. Labor Supply of New York City

Cabdrivers : One Day at a Time. The Quaterly Journal of Economics, pages 407�441, may

1997.

Cameron, C. A. et P. K. Trivedi. Microeconometrics : Methods and Applications. Cambridge

University Press, 32 Avenue of the Americas, New York, NY 100013-2473, USA, eighth

edition, 2005.

Chang T. et T. Gross. How Many Pears Would a Pear Packer Pack if a Pear Packer Could

Pack Pears at Quasi-Exogenously Varying Piece Rates ? Journal of Economic Behavior and

Organization, 99 :1�17, 2014.

Chou, Yuan K. Testing Alternative Models of Labor Supply : Evidence from Taxi-Drivers in

Singapore. The Singapore Economic Review, 47, 2002.

Crawford, V.P. et J. Meng. New York City Cab Drivers' Labor Supply Revisited : Reference-

Dependent Preferences with Rational-Expectations Targets for Hours and Income. American

Economic Review, 101 :1912�1932, 2011.

Daniel Kahneman, Jack L. Knetsch et Richard H. Thaler. Experiemental Tests of the Endow-

ment E�ect and the Coase Theorem. Journal of Political Economy, 98(6) :1325�1348, dec

1990.

Deb, Partha. Fmm - module to estimate �nite mixture models, 2012.

http ://fmwww.bc.edu/RePEc/bocode/f.

45

Doran, Kirk B. Are Long-term Wage Elasticities of Labord Supply More Negative than Short-

term Ones ? Economics Letters, 122(2) :208�210, 2014.

Farber, Henry S. Is Tomorrow Another Day ? The Labor Supply of New York City Cabdrivers.

Journal of Political Economy, 113(1) :46�82, 2005.

Farber, Henry S. Reference-Dependent Preferences and Labor Supply : The Case of New York

City Taxi Drivers. American Economic Review, 98(3) :1069�1082, jun 2008.

Farber, Henry S. Why You Can't Find a Taxi in the Rain and Other Labor Supply Lessons

from Cab Drivers. The Quaterly Journal of Economics, 130(4) :1975�2026, jul 2015.

Fehr, E. et L. Goette. Do Workers Work More if Wages Are High ? Evidence from a Rando-

mized Field Experiment. American Economic Review, 97(1) :298�317, mar 2007.

Greene, William. Économétrie. Pearson, One Lake Street, Upper Saddle River, NJ 07 458,

États-Unis, seventh edition, 2011.

Jehle, G. A. et P. J. Reny. Advanced Economic Theory. Pearson, Edinburgh Gate, Harlow,

Essex CM20 2JE, third edition, 2011.

Kahneman D. et A. Tversky. Prospect Theory : An Analysis of Decision under Risk. Econo-

metrica, 47(2) :263�291, mar 1979.

Kahneman D. et A. Tversky. Choices, Values, and Frames. American Psychologist, 39 :

341�350, apr 1984.

K®szegi, B. et M. Rabin. A Model of Reference-Dependent Preferences. The Quaterly Journal

of Economics, 121(4) :1133�1165, nov 2006.

MaCurdy, Thomas E. An Empirical Model of Labor Supply in a Life-Cycle Setting. Journal

of Political Economy, 89(6) :1059�1085, 1981.

Mingfeng, L., H. C. Lucas Jr et G. Shmueli. Research Commentary- Too Big to Fail : Large

Samples and the p-value Problem. Information Systems Research, 24(4) :906�917, 2013.

Oettinger, Gerald S. An Empirical Analysis of the Daily Labor Supply of Stadium Vendor.

The Journal of Political Economy, 107(2) :360�392, apr 1999.

Scha�er, M. E. xtivreg2 : Stata module to perform extended IV/2SLS, GMM

and AC/HAC, LIML and k-class regression for panel data models, 2010.

http ://ideas.repec.org/c/boc/bocode/s456501.html.

Smyth, Padhraic. Note Set 4 : Finite Mixture Models and the EM Algorithm. URL http:

//www.ics.uci.edu/~smyth/courses/cs274/notes/notes4.pdf.

46

Stéphane Carcillo, Pierre Cahuc et André Zylberberg. Labor Economics. The MIT Press,

second edition, 2014.

Tversky A. et D. Kahneman. Loss Aversion in Riskless Choice : A Reference-Dependent Model.

The Quaterly Journal of Economics, 106 :1039�1061, nov 1991.

Whong, Christopher M. FOILing NYC's Taxi Trip Data, mar 2014. URL http://chriswhong.

com/open-data/foil_nyc_taxi/.

47

Annexe 1

Preuve mathématique du modèle reference-dependent

Soit la fonction d'utilité suivante, qui admet de l'aversion à la perte.

U(h) =

a(Y − T )− h1+σ si Y − T < 0

b(Y − T )− h1+σ si Y − T ≥ 0

Où Y = wh est le revenu, T est l'objectif de l'individu en terme de revenu, w est le salaire

horaire, h est le nombre d'heures travaillées, a > b > 0 sont des coe�cients qui servent à

contrôler l'utilité marginale avant et après l'atteinte de l'objectif et σ > 0 est un paramètre

a�ectant l'élasticité salaire de l'o�re.

� Si Y − T < 0 :

∂U

∂h= aw − (1 + σ)hσ = 0

aw = (1 + σ)hσ

h∗ =( aw

1 + σ

) 1σ

Cette équation nous donne l'o�re de travail. L'élasticité salaire de l'o�re est donnée

par :

48

∂h

∂w× w

h=

1

σ

( aw

1 + σ

) 1σ−1× a

1 + σ× w

h

=1

σ

( aw

1 + σ

) 1σ−1× aw

1 + σ× 1

h

=1

σh×( aw

1 + σ

) 1σ

=1

σ× h

h=

1

σ> 0

Ainsi à des niveaux de salaires qui ne permettent pas d'atteindre la cible que le tra-

vailleur se �xe, l'élasticité salaire de l'o�re de travail est positive. À ces niveaux de

salaires, il se comporte donc comme dans le modèle intertemporel. Une augmentaiton

du salaire entraine une augmentation des heures travaillées.

� Si Y − T > 0 :

Comme la seule di�érence avec le cas où Y −T < 0 est que le paramètre a est remplacé

par b, l'élasticité salaire de l'o�re est la même dans les deux cas. Ceci implique qu'à des

niveaux de salaire qui sont supérieurs à ceux nécéssaires pour l'atteinte de la cible, le

travailleur se comporte ici aussi de la même manière que pour le modèle intertemporel.

� Si Y − T = 0

Y = T

wh = T

h∗ =T

w

À des niveaux de salaires qui permettent d'atteindre la cible, mais pour lesquels le

travailleur attribue une valeur plus élevée à l'heure de loisir supplémentaire, l'o�re de

travail ne dépend que du montant �xé et du salaire.

∂h

∂w× w

h=−Tw2× w

T× w

= −1

49

Pour les niveaux de salaires intermédiaires, l'élasticité salaire de l'o�re est de -1. Ainsi,

une augmentation de salaire contenue dans cet intervalle fait en sorte que le travailleur

atteint son objectif plus rapidement. Puisqu'il attribue toujours une valeur supérieure

à son loisir, il arrêtera de travailler une fois l'objectif atteint.

50

Annexe 2

E�ets marginaux du modèle probit

Table .9 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de janvier

Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%

Montant cumulé ($) -.0000847 2.57e-06 -32.96 0.000 -.0000897 -.0000796Temps cumulé (h) .0130354 .0000355 366.73 0.000 .0129657 .013105Nombre de courses -.0002091 .0000156 -13.38 0.000 -.0002398 -.0001785Distance e�ecutée .0002473 5.15e-06 48.03 0.000 .0002373 .0002574Montant dernière course ($) .0010324 4.01e-06 257.30 0.000 .0010245 .0010403Salaire 5 dernières courses ($/h) 2.51e-09 1.14e-09 2.21 0.027 2.84e-10 4.75e-09Pluie (mm/h) -.0026939 .0001466 -18.38 0.000 -.0029813 -.0024066Vent (km/h) -.0000619 8.76e-06 -7.07 0.000 -.0000791 -.0000447Température (°F) .0001373 5.15e-06 26.69 0.000 .0001272 .0001474

JourLundi -.0194856 .0002093 -93.11 0.000 -.0198958 -.0190755Mardi .0027267 .0002375 11.48 0.000 .0022612 .0031922Mercredi .004452 .0002253 19.76 0.000 .0040103 .0048937Jeudi -.0008673 .0002251 -3.85 0.000 -.00013084 -.0004261Vendredi -.0058382 .0002239 -26.08 0.000 -.006277 -.0053994Samedi -.016716 .0002099 -79.65 0.000 -.0171274 -.0163046

FêtesNouvel An .0126158 .0003865 32.64 0.000 .0118583 .0133733

Période du jourAprès-midi .0294706 .0001404 209.93 0.000 .0291955 .0297458Soir .0078643 .0001318 59.68 0.000 .007606 .0081226Nuit .0645512 .0002286 281.13 0.000 .0641011 .0650012

51

Table .10 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de février


Montant cumulé ($) -.0000734 2.47e-06 -29.77 0.000 -.0000783 -.0000686Temps cumulé (h) .0123272 .0000363 339.35 0.000 .012256 .0123984Nombre de courses -.0001394 .0000151 -9.23 0.000 -.000169 -.0001098Distance e�ecutée .0002273 4.97e-06 45.78 0.000 .0002176 .0002371Montant dernière course ($) .0010434 4.02e-06 259.72 0.000 .0010356 .0010513Salaire 5 dernières courses ($/h) -4.70e-09 4.11e-09 -1.14 0.253 -1.28e-08 3.36e-09Pluie (mm/h) .0066433 .0000979 67.83 0.000 .0064513 .0068352Vent (km/h) -.0004836 9.36e-06 -51.65 0.000 -.0005019 -.0004652Température (°F) -.000232 8.47e-06 -27.40 0.000 -.0002486 -.0002154


FêtesSaint-Valentin -.0011312 .0002995 -3.78 0.000 -.0017182 -.0005443Super Bowl -.0051025 .000311 -16.41 0.000 -.005712 -.004493


52

Table .11 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de mars


Montant cumulé ($) -.0000741 2.32e-06 -31.97 0.000 -.0000787 -.0000696Temps cumulé (h) .0127671 .0000346 368.75 0.000 .0126992 .0128349Nombre de courses -.000117 .0000143 -8.19 0.000 -.000145 -.000089Distance e�ecutée .0002211 4.66e-06 447.47 0.000 .000212 .0002303Montant dernière course ($) .0010529 3.72e-06 282.66 0.000 .0010456 .0010602Salaire 5 dernières courses ($/h) 9.49e-09 1.15e-09 0.82 0.411 -1.31e-08 3.21e-08Pluie (mm/h) .0011626 .0001303 8.92 0.000 .0009073 .0014179Vent (km/h) -.0001406 7.80e-06 -18.03 0.000 -.0001559 -.0001254Température (°F) -.00008 9.88e-06 -8.09 0.000 -.0000994 -.0000606


FêtesPâque .0041604 .0003688 11.28 0.000 .0034377 .0048832


53

Table .12 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois d'avril


Montant cumulé ($) -.0000693 2.27e-06 -30.54 0.000 -.0000737 -.0000648Temps cumulé (h) .0128709 .0000357 360.69 0.000 .012801 .0129408Nombre de courses -.0001233 .0000144 -8.54 0.000 -.0001515 -.000095Distance e�ecutée .0002138 4.50e-06 47.51 0.000 .000205 .0002226Montant dernière course ($) .0010481 3.72e-06 281.81 0.000 .0010409 .0010554Salaire 5 dernières courses ($/h) 3.22e-09 1.04e-08 0.31 0.758 -1.72e-08 2.37e-08Pluie (mm/h) .0012708 .0001387 9.17 0.000 .0009991 .0015426Vent (km/h) .0001154 9.02e-06 12.79 0.000 .0000977 .000133Température (°F) .0000629 6.01e-06 10.47 0.000 .0000511 .0000747



54

Table .13 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de mai


Montant cumulé ($) -.0000241 2.14e-06 -11.30 0.000 -.0000283 -.00002Temps cumulé (h) .013085 .0000369 354.64 0.000 .0130127 .0131573Nombre de courses -.0002827 .0000142 -19.92 0.000 -.0003106 -.0002549Distance e�ecutée .0001162 4.21e-06 27.58 0.000 .000108 .0001245Montant dernière course ($) .0010853 3.70e-06 293.22 0.000 .000108 .0001245Salaire 5 dernières courses ($/h) 6.37e-09 3.60e-9 1.77 0.077 -6.87e-10 1.34e-08Pluie (mm/h) -.0000628 .000033 -1.90 0.057 -.0001274 1.83e-06Vent (km/h) .0002533 9.56e-06 26.48 0.000 .0002345 .000272Température (°F) -.0001286 5.86e-06 -21.94 0.000 -.0001401 -.0001171

JourLundi -.0178836 .0002242 -79.75 0.000 -.0183231 -.0174441Mardi .0048398 .0002502 19.34 0.000 .00434=94 .0053301Mercredi .0037993 .0002374 16.01 0.000 .0033341 .0042646Jeudi .0004309 .0002377 1.81 0.070 -.000035 .0008968Vendredi -.0058183 .000226 -25.75 0.000 -.0062611 -.0053754Samedi -.0152113 .0002229 -68.26 0.000 -.0156481 -.0147745

FêtesJour du souvenir .0048001 .0004133 11.61 0.000 .00399 .005602


55

Table .14 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de juin


Montant cumulé ($) -.0000805 2.57e-06 -31.29 0.000 -.0000856 -.0000755Temps cumulé (h) .0132294 .000038 348.04 0.000 .0131549 .0133039Nombre de courses -.0000816 .0000162 -5.03 0.000 -.0001135 -.0000498Distance e�ecutée .0002545 5.22e-06 48.75 0.000 .0002442 .0002647Montant dernière course ($) .0010968 3.93e-06 279.21 0.000 .0010892 .0011045Salaire 5 dernières courses ($/h) 3.77e-09 7.72e-08 0.49 0.625 -1.14e-08 1.89e-08Pluie (mm/h) -.0017062 .0000415 -41.08 0.000 -.0017877 -.0016248Vent (km/h) -.0001055 .0000107 -9.86 0.000 -.0001265 -.0000845Température (°F) -.0002951 8.88e-06 -33.22 0.000 -.0003126 -.0002777

JourLundi -.0196635 .0002171 -90.55 0.000 -.0200891 -.0192379Mardi .0024254 .000213 11.38 0.000 .0020079 .002843Mercredi .0002119 .0002133 0.99 0.321 -.0002062 .00063Jeudi -.0023821 .0002133 -11.17 0.000 -.0028002 -.001964Vendredi -.0058988 .0002138 -27.59 0.000 -.0063178 -.005498Samedi -.0153532 .0002068 -74.24 0.000 -.0157585 -.0149479


56

Table .15 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de juillet


Montant cumulé ($) -.000097 2.75e-06 -35.29 0.000 -.0001024 -.0000916Temps cumulé (h) 0.0129531 .0000375 345.62 0.000 .0128796 .0130265Nombre de courses -.0000111 .0000176 -0.63 0.526 -.0000455 .0000233Distance e�ecutée .0003048 5.64e-06 54.08 0.000 .0002937 .0003158Montant dernière course ($) .0011138 4.16e-06 267.55 0.000 .0011056 .0011219Salaire 5 dernières courses ($/h) 3.70e-08 1.31e-08 2.84 0.005 1.14e-08 6.26e-08Pluie (mm/h) .0000574 .0000667 0.86 0.390 -.0000734 .0001882Vent (km/h) -.000029 .0000117 -2.47 0.013 -.0000519 -6.00e-06Température (°F) 4.22e-06 8.32e-06 0.51 0.612 -.0000121 .0000205


Fêtes4 Juillet .0023954 .0003981 6.02 0.000 .001615 .0031757


57

Table .16 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois d'août


Montant cumulé ($) -.0000903 3.06e-06 -29.48 0.000 -.0000963 -.0000843Temps cumulé (h) .0136269 .0000404 336.91 0.000 .0135476 .0137061Nombre de courses -.000102 .0000188 -5.43 0.000 -.0001388 -.0000651Distance e�ecutée .0002545 6.15e-06 41.42 0.000 .0002425 .0002666Montant dernière course ($) .0011159 4.55e-06 245.40 0.000 .001107 .0011248Salaire 5 dernières courses ($/h) 2.21e-09 9.62e-09 0.23 0.819 -1.66e-08 2.11e-08Pluie (mm/h) -.0016103 .0000917 -17.57 0.000 -.00179 -.0014307Vent (km/h) -.0003545 .0000132 -26.95 0.000 -.0003803 -.0003287Température (°F) -.0000312 .0000147 -2.11 0.035 -.0000601 -2.26e-06

JourLundi -.0253568 .0002613 -97.03 0.000 -.025869 -.0248446Mardi -.0010735 .0002282 -4.70 0.000 -.0015208 -.0006262Mercredi -.0022048 .0002245 -9.82 0.000 -.0026448 -.0017648Jeudi -.0034753 .0002189 -15.88 0.000 -.0039043 -.0030463Vendredi -.0124749 .0002217 -56.27 0.000 -.0129094 -.0120404Samedi -.0189119 .0002317 -81.60 0.000 -.0193661 -.0184576

Période du jourAprès-midi .0363238 .0002449 148.35 0.000 .0358439 .0368038Soir -.0001038 .000255 -0.41 0.684 -.0006037 .000396Nuit .0544833 .0002551 213.54 0.000 .0539832 .0549833

58

Table .17 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de septembre


Montant cumulé ($) -.0000963 2.52e-06 -38.20 0.000 -.0001012 -.0000914Temps cumulé (h) .0131787 .0000375 351.27 0.000 .0131051 .0132522Nombre de courses .0000679 .0000162 4.18 0.000 .0000361 .0000997Distance e�ecutée .00029 5.16e-06 56.22 0.000 .0002799 .0003002Montant dernière course ($) .001057 3.87e-06 273.30 0.000 .0010494 .0010646Salaire 5 dernières courses ($/h) -5.43e-09 3.04e-09 -1.79 0.074 -1.14e-08 5.29e-10Pluie (mm/h) -.0023437 .0000492 -47.63 0.000 -.0024402 -.0022473Vent (km/h) .0005739 .0000123 46.76 0.000 .0005498 .0005979Température (°F) -.000215 7.82e-06 -27.49 0.000 -.0002303 -.0001997

JourLundi -.0187532 .0002121 -88.41 0.000 -.0191689 -.0183375Mardi .0043329 .0002443 17.74 0.000 .0038542 .0048117Mercredi .0057207 .0002518 22.72 0.000 .0052271 .0062143Jeudi .0016798 .0002377 7.07 0.000 .0012139 .0021457Vendredi -.0074377 .0002191 -33.95 0.000 -.007867 -.0070083Samedi -.0193631 .0002085 -92.86 0.000 -.0197718 -.0189544

FêtesFête du travail -.0027724 .0003899 -7.11 0.000 -.0035366 -.0020082


59

Table .18 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de octobre


Montant cumulé ($) -.0000966 2.48e-06 -39.03 0.000 -.0001015 -.0000918Temps cumulé (h) .0130487 .0000362 360.29 0.000 .0129777 .0131196Nombre de courses .0000714 .0000158 4.51 0.000 .0000404 .0001025Distance e�ecutée .0002839 5.06e-06 56.08 0.000 .000274 .0002938Montant dernière course ($) .0010425 3.64e-06 286.44 0.000 .0010354 .0010496Salaire 5 dernières courses ($/h) -1.92e-08 2.11e-08 -0.91 0.361 -6.05e-08 2.20e-08Pluie (mm/h) -.0155228 .0005123 -30.30 0.000 -.0165268 -.0145188Vent (km/h) -.0004148 9.27e-06 -44.76 0.000 -.000433 -.0003966Température (°F) -.0001091 6.23e-06 -17.52 0.000 -.0001213 -.0000969

JourLundi -.0242271 .0002231 -108.61 0.000 -.0246643 -.0237899Mardi -.0002338 .0002014 -1.16 0.246 -.0006285 .0001608Mercredi -.0010047 .0001982 -5.07 0.000 -.0013932 -.0006163Jeudi -.004832 .0001972 -24.51 0.000 -.0052185 -.004455Vendredi -.0089877 .0002065 -43.53 0.000 -.0093924 -.0085831Samedi -.0227098 .0002147 -105.76 0.000 -.0231306 -.0222889


60

Table .19 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de novembre


Montant cumulé ($) -.0001312 2.56e-06 -51.16 0.000 -.0001363 -.0001262Temps cumulé (h) .0129984 .0000375 346.89 0.000 .0129249 .0130719Nombre de courses .0002764 .0000167 16.57 0.000 .0002437 .0003091Distance e�ecutée .0003577 5.35e-06 66.83 0.000 .0003472 .0003682Montant dernière course ($) .0010786 3.93e-06 274.60 0.000 .0010709 .0010863Salaire 5 dernières courses ($/h) 8.12e-09 3.06e-09 2.65 0.008 2.12e-09 1.41e-08Pluie (mm/h) .0035132 .0000888 39.55 0.000 .0033391 .0036973Vent (km/h) -.0002982 .0000101 -29.66 0.000 -.0003179 -.0002785Température (°F) -.0004047 6.05e-06 -66.92 0.000 -.0004166 -.0003929

JourLundi -.0223708 .0002188 -102.23 0.000 -.0227997 -.0219419Mardi .0011409 .0002455 4.65 0.000 .0006597 .0016221Mercredi .0001232 .0002443 0.50 0.614 -.0003557 .0006021Jeudi -.0022809 .0002538 -8.99 0.000 -.0027782 -.0017835Vendredi -.0070389 .0002261 -31.13 0.000 -.0074821 -.0065956Samedi -.0186801 .0002115 -88.30 0.000 -.0190947 -.0182655

FêtesAction de Grâce .0004946 .0003833 1.29 0.197 -.0002566 .0012458


61

Table .20 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de décembre


Montant cumulé ($) -.0001615 2.57e-06 -62.83 0.000 -.0001665 -.0001564Temps cumulé (h) .0134362 .0000377 355.95 0.000 .0133623 .0135102Nombre de courses .0004242 .0000173 24.58 0.000 .0003904 .0004581Distance e�ecutée .000407 5.43e-06 74.97 0.000 .0003963 .0004176Montant dernière course ($) .0011117 3.95e-06 281.12 0.000 .001104 .0011195Salaire 5 dernières courses ($/h) -3.45e-09 2.36e-09 -1.46 0.144 -8.07e-09 1.17e-08Pluie (mm/h) -.0017386 .0000742 -23.42 0.000 -.0018841 -.0015931Vent (km/h) -.0005146 9.99e-06 -51.51 0.000 -.0005341 -.000495Température (°F) -.0000344 5.75e-06 -5.99 0.000 -.0000457 -.0000232

JourLundi -.0133969 .0002021 -66.30 0.000 -.0137929 -.0130008Mardi .0060917 .0002333 26.11 0.000 .0056345 .0065489Mercredi .0023105 .0002423 9.54 0.000 .0018356 .0027854Jeudi .002022 .0002257 8.96 0.000 .0015796 .0024644Vendredi -.0045926 .0002134 -21.52 0.000 -.0050108 -.0041744Samedi -.012359 .0002079 -59.45 0.000 -.0127665 -.0119515

FêtesNöel .0146235 .0005129 28.51 0.000 .0136183 .0156287Veille du jour de l'an .0138434 .0003872 35.75 0.000 .0130846 .0146022


62

Documents

L'offre de travail des chauffeurs de taxi: Un duel de modèles€¦ · Bernard Fortin, codirecteur de recherche. ... iii. Table des matières Résumé iii ableT des matières iv Liste