Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
L’offre de travail des chauffeurs de taxiUn duel de modèles
Mémoire
Hugo Leblond
Maîtrise en économieMaître ès arts (M.A.)
Québec, Canada
© Hugo Leblond, 2017
L’offre de travail des chauffeurs de taxiUn duel de modèles
Mémoire
Hugo Leblond
Sous la direction de:
Vincent Boucher, directeur de rechercheBernard Fortin, codirecteur de recherche
Résumé
L'objectif de ce mémoire est d'identi�er le modèle de comportement qui illustre le mieux le
processus décisionnel du travailleur. Plus particulièrement, j'y oppose le modèle intertemporel
au modèle d'atteinte d'objectif (ou modèle reference-dependent). Pour ce faire, j'utilise des
données portant sur l'ensemble des courses e�ectuées par les chau�eurs de taxi new-yorkais
pour l'année 2013. A�n de simuler des variations de salaire, j'utilise les conditions météorolo-
giques.
J'observe d'abord, à l'aide de plusieurs régressions par Moindres Carrés Ordinaires, les réac-
tions du marché lors d'une période de mauvais temps. À la fois l'o�re et la demande semblent
augmenter. Je tente ensuite, à l'aide d'un modèle de mélange gaussien, de déterminer s'il y a
de l'hétérogénéité dans le comportement des chau�eurs. Je trouve un possible e�et de spécia-
lisation. Je continue mon analyse par l'estimation d'élasticités en régressant le log du nombre
d'heures travaillées sur le log du salaire. Je me prémunis du problème d'endogénéité du sa-
laire en utilisant l'estimateur par Moindre Carrés en Deux Étapes, avec comme instruments le
niveau de précipitation moyen et la vitesse moyenne du vent lors du quart de travail. Les élas-
ticités obtenues se situent entre 0,43 et 0,57. Je termine avec l'estimation d'un modèle probit
sur la probabilité d'arrêter de travailler, avec comme facteurs principaux le nombre d'heures
e�ectuées et le montant d'argent accumulé. L'e�et rapporté pour le montant accumulé est
négatif.
Dans l'ensemble, les résultats sont en accord avec le modèle intertemporel.
iii
Table des matières
Résumé iii
Table des matières iv
Liste des tableaux v
Liste des �gures vii
Remerciements ix
Introduction 1
1 Revue de littérature 31.1 Mise en contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Les tenants du modèle reference-dependent . . . . . . . . . . . . . . . . . . . 41.3 Les partisans du modèle intertemporel . . . . . . . . . . . . . . . . . . . . . 6
2 Les modèles en opposition 82.1 Le modèle intertemporel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2 Le modèle reference-dependent . . . . . . . . . . . . . . . . . . . . . . . . . 122.3 Distinction des modèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Les données 163.1 Source et manipulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2 Pourquoi l'industrie du taxi ? . . . . . . . . . . . . . . . . . . . . . . . . . . 193.3 Sur l'utilisation de grandes bases de données . . . . . . . . . . . . . . . . . . 20
4 Méthodologie et résultats 214.1 Véri�cation d'hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.2 Les réactions du marché face à la pluie . . . . . . . . . . . . . . . . . . . . . 234.3 Estimation d'élasticités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334.4 Modèle de choix discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Conclusion 44
Bibliographie 45
iv
Liste des tableaux
3.1 Description des données sous forme par course . . . . . . . . . . . . . . . . . . . 183.2 Distribution des courses selon le temps . . . . . . . . . . . . . . . . . . . . . . . 183.3 Description des données sous forme par quart . . . . . . . . . . . . . . . . . . . 19
4.1 Réactions du marché des taxis au mauvais temps. Régressions par MCO (sanscontrôles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.2 Réactions du marché des taxis au mauvais temps. Régressions par MCO (aveccontrôles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3 Résultats d'un FMM à deux composantes d'une régression du nombre de courses/heuresur le mauvais temps. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4 Résultats d'un FMM à deux composantes d'une régression du nombre d'heurestravaillées sur le mauvais temps . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.5 Résultats d'un FMM à deux composantes d'une régression de la distance/heuresur le mauvais temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.6 Résultats de la première étape des régressions par MC2E . . . . . . . . . . . . . 364.7 Élasticitées estimées par MC2E . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.8 E�ets marginaux moyen d'une estimation probit, par mois, de la probabilité
d'arrêter de travailler à la �n d'une course . . . . . . . . . . . . . . . . . . . . . 43.9 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois de janvier . . . . . . . . . . . . . . 51.10 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois de février . . . . . . . . . . . . . . . 52.11 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois de mars . . . . . . . . . . . . . . . . 53.12 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois d'avril . . . . . . . . . . . . . . . . 54.13 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois de mai . . . . . . . . . . . . . . . . 55.14 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois de juin . . . . . . . . . . . . . . . . 56.15 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois de juillet . . . . . . . . . . . . . . . 57.16 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois d'août . . . . . . . . . . . . . . . . 58.17 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter de
travailler à la �n d'une course pour le mois de septembre . . . . . . . . . . . . . 59
v
.18 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de octobre . . . . . . . . . . . . . . 60
.19 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de novembre . . . . . . . . . . . . . 61
.20 E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de décembre . . . . . . . . . . . . . 62
vi
Liste des �gures
2.1 Fonction d'utilité et courbre d'indiférence reference-dependent linéarisé. . . . . 13
vii
À ma petite soeur Audrey qui,
comme un taxi, ne reste jamais
longtemps en place.
viii
Remerciements
En premier lieu, je tiens à remercier chaleureusement mes directeurs, MM. Vincent Boucher
et Bernard Fortin, sans qui ce mémoire ne serait qu'une pâle copie de lui-même. Vincent, par
sa grande générosité, sa disponibilité, son enthousiasme (et bien d'autres raisons), a fortement
contribué à faire de ma maitrise une expérience heureuse.
Je désire également souligner mon immense gratitude pour le Centre de recherche sur les
risques, les enjeux économiques et les politiques publiques (CRREP), qui par son �nancement
aura permis bien plus que la simple complétion d'un travail universitaire.
Le corps professoral du département, pour la qualité d'enseignement, la passion et le dé-
vouement dont j'ai été témoin depuis le tout début de ma formation au baccalauréat, mérite
également le témoignage de ma reconnaissance.
Je ne peux oublier mes parents, Mario et Francine, à qui je dois tout. Merci ! Je ne le démontre
pas souvent, mais sachez que je vous aime. Avec votre soutien, j'ai encore une fois � battu
Bowser �.
En�n, impossible d'oublier ma copine Marie-Êve, qui mérite bien plus que des remerciements
pour ses sacri�ces et sa patience lors des deux dernières années. À toi, je dirai simplement ceci
... � Ta*****k ! Merci hein ! �.
Je m'arrête ici, bien que je pourrais continuer ainsi et faire de ces remerciements un chapitre
complet, tant il y a de personnes envers lesquelles je suis reconnaissant . . .
ix
Introduction
Parmi les modèles les plus étudiés en économie du travail se trouve le modèle néoclassique
intertemporel (ou modèle du cycle de vie). Au nombre des prédictions de ce modèle, on re-
trouve que le travailleur cherche à augmenter le nombre d'heures o�ertes lorsqu'il observe une
augmentation temporaire de son salaire (en absence d'e�et de richesse).
Bien que cette prédiction semble évidente, Camerer, Babcock, Lowenstein et Thaler (1997), en
analysant le comportement des chau�eurs de taxi new-yorkais, identi�ent plutôt une relation
négative entre variation temporaire du salaire et heures de travail. Ceux-ci travailleraient donc
longtemps lorsque les salaires sont faibles et peu lorsqu'ils sont élevés.
Dans le but de trouver une explication à cette curiosité, les auteurs suggèrent l'utilisation
d'un modèle qui tire son origine de la théorie d'aversion à la perte, développée entre autres
dans les articles de Kahneman et Tversky (1979) et Tversky et Kahneman (1991). Dans ce
modèle, on suppose que l'individu a des préférences qui dépendent d'un point de référence
(ici en termes de revenu). On suppose de plus que l'agent est plus sensible aux variations de
revenu qui le mènent en desous de ce point de référence qu'aux variations le menant au-dessus.
La conséquence directe de ces deux hypothèses est qu'il se crée une cassure autour du point
de référence, qui mène à cette relation négative.
Plusieurs études ont depuis tenté d'opposer ces deux modèles et ce dans divers contextes.
Certains donnent raison au modèle intertemporel. C'est le cas, entre autres, de Oettinger
(1999) pour des données portant sur les vendeurs de hot-dog dans les stades de baseball
américains. Fehr et Gotte (2007), qui utilisent des données sur les courriers à vélo allemands,
estiment eux aussi des élasticités positives. Ces derniers observent cependant une diminution
de l'e�ort fourni chez certains travailleurs, ce qui les incitent à croire en la pertinence du
modèle alternatif. En utilisant des données fournies par une �rme d'empaquetage de poires,
Chang et Grass (2013) argumentent en faveur du modèle avec point de référence.
L'objectif de mon mémoire sera donc d'identi�er lequel de ces deux modèles est le plus adé-
quat pour expliquer mes données. Celles-ci portent sur l'industrie du taxi new-yorkais et com-
prennent la totalité des courses e�ectuées au courant de l'année 2013. À l'instar des études qui
m'ont précédé, la méthode utilisée pour départager le modèle vainqueur de ce duel se résume
1
principalement à l'estimation de quelques élasticités par moindres carrés ordinaires et par va-
riables instrumentales, ainsi que d'un modèle probit sur la décision d'arrêter de travailler suite
à l'accomplissement d'une course.
La pertinence de cet exercice s'inscrit d'abord dans un contexte académique. De plus, dans
la mesure où le processus de mise en place et d'évaluation des politiques �scales est basé sur
l'idée de posséder des prédictions solides, on peut trouver un intérêt provenant des instances
gouvernementales. Si, comme le prétendent Camerer, Babcock, Lowenstein et Thaler (1997),
l'o�re de travail d'un individu est déterminée selon un modèle di�érent du modèle intertem-
porel, l'utilisation des estimés habituels pourrait poser problème. Il peut également y avoir
un intérêt provenant du côté entrepreneurial. Une bonne compréhension de la façon dont ré-
agissent les travailleurs suite à une variation de leur salaire peut avoir un impact important
quant à la structure d'incitatifs qu'une entreprise doit mettre en place.
L'apport principal de ce travail à la littérature se fait avant tout par de nouvelles estima-
tions d'élasticités. De plus, l'utilisation de données d'une aussi grande ampleur est peu com-
mune. En�n, l'utilisation d'un modèle de mélange gaussien (Finite Mixture Model) dans le
but d'explorer l'hétérogénéité du comportement chez les chau�eurs est, à ma connaissance,
une première.
Le reste de mon mémoire est présenté comme suit. Dans le premier chapitre, j'expose une
revue de littérature, composée des principaux articles qui analysent le contexte des chau�eurs
de taxi. Dans le second chapitre, j'explique de façon plus exhaustive les deux modèles qui
sont mis en opposition. À travers le troisième chapitre, je discute des données utilisées, de
leur pertinence et souligne quelques di�cultés associées à leur utilisation. Tout au long du
quatrième chapitre, je fais l'exposé des méthodes retenues pour mener à bien mon analyse et
je rapporte les résultats obtenus.
2
Chapitre 1
Revue de littérature
Dans ce chapitre, je présente le contexte duquel est née la littérature sur mon sujet. Je résume
ensuite les principales études qui font l'analyse du comportement d'o�re de travail et qui
utilisent des données sur les chau�eurs de taxi. Je distingue celles-ci selon le modèle que
favorisent leurs conclusions, tout en essayant de conserver un ordre chronologique.
1.1 Mise en contexte
Dans Tversky et Kahneman (1991), les auteurs font suite à leurs travaux sur les choix en
situation d'incertitude et développent le type de modèle reference-dependent 1. À travers cet
article, ils argumentent que le modèle classique de prise de décision par maximisation d'uti-
lité ne re�ète pas correctement la réalité. Plus précisément, le modèle généralement présenté
fait l'hypothèse que l'utilité est continûment di�érentiable. Cette hypothèse est démentie par
les auteurs, qui suggèrent au contraire la présence possible d'une discontinuité dans l'utilité
marginale. Ainsi selon eux, le taux auquel l'individu est prêt à échanger un bien est di�érent
selon qu'il s'agisse pour lui de faire l'acquisition ou de subir une perte dudit bien. Les auteurs
démontrent le bien-fondé de leur hypothèse en relatant une variété de constats expérimentaux.
Entre autres exemples, les auteurs rapportent une expérience menée à plusieurs reprises par
Kahneman, Knetsch et Thaler (1990).
Dans cette expérience, une tasse est distribuée aléatoirement au tiers des étudiants d'une
classe. Chaque participant reçoit ensuite un questionnaire. Au tiers possédant une tasse (les
� vendeurs �), il est demandé d'indiquer, pour plusieurs prix allant de 0,50$ à 9,50$, s'ils sont
prêts à vendre la tasse ou non. De façon similaire, certains autres étudiants (les � choisisseurs �)
devaient indiquer, pour les mêmes prix, leurs préférences entre une tasse et la somme d'argent.
À travers cette expérience, les deux groupes sont placés dans la même situation, à la di�érence
près de leur dotation initiale. Tous doivent choisir entre une tasse ou une somme d'argent. Du
1. Kahneman et Tversky (1979, 1984).
3
point de vue des choisisseurs, puisqu'ils ne possèdent rien, les deux options sont perçues comme
des gains. Les vendeurs quant à eux perçoivent l'échange (en partie) comme la perte de leur
dotation. Comme les deux situations re�ètent un choix identique, on s'attendrait à voir des
réponses similaires pour les deux groupes. Toutefois, les réponses aux questionnaires indiquent
que la valeur médiane attribuée à la tasse était de près de 7,00$ pour les vendeurs et près de
3,50$ pour les choisisseurs. Les auteurs expliquent cette di�érence par ce qu'ils appellent un
e�et de dotation (endowment e�ect). Cet e�et peut se résumer ainsi : le fait de posséder un
objet (qui possède une valeur d'usage autre que l'échange) entraine une sorte d'attachement
émotionnel, qui contribuerait à la douleur associée à l'action de s'en départir.
A�n d'apporter une explication à l'ensemble des constats qu'ils présentent, Tversky et Kah-
neman proposent une alternative au modèle classique de prise de décision. Dans ce nouveau
modèle, quali�é de reference-dependent, le preneur de décision est considéré comme étant
averse à la perte.
1.2 Les tenants du modèle reference-dependent
1.2.1 Camerer, Babcock, Loewenstein et Thaler (1997)
Dans le contexte du travailleur qui doit déterminer ses heures de travail et de loisir, le modèle
intertemporel ne semble pas avoir toujours vu ses prédictions être confortées. L'une de ces
prédictions est que suite à une variation de salaire temporaire n'a�ectant pas l'utilité marginale
de la richesse du travailleur, celui-ci travaillera davantage.
Dans certaines études cependant, qu'elles aient été menées sur une base de données agrégée,
de cohorte ou en panel, les estimations d'élasticités salaire de l'o�re de travail étaient faibles
et non signi�catives ou encore négatives. C'est du moins ce que rapportent Camerer, Babcock,
Loewenstein et Thaler (1997). Les études susmentionnées analysent cependant des contextes où
les variations de salaire sont rarement réellement temporaires, ce qui nécessite des hypothèses
supplémentaires. Au �nal, comme le soulignent les auteurs, les résultats déconcertants obtenus
par celles-ci peuvent être attribuables à des erreurs de spéci�cation.
Dans le but de tester le comportement d'o�re de travail suite à une variation transitoire
du salaire, les auteurs proposent l'utilisation d'un contexte où les salaires sont relativement
constants à travers une journée et non corrélés d'un jour à l'autre. Il leur sera ainsi possible
d'éviter les pièges rencontrés par leurs prédécesseurs. Dans un tel contexte, une augmenta-
tion de salaire, puisqu'elle est temporaire, n'a qu'un impact négligeable sur la richesse du
travailleur. Suivant cette proposition, les auteurs retiennent des données sur les chau�eurs de
taxi new-yorkais pour leur analyse. Pour ces travailleurs, les salaires dépendent en partie de
chocs temporaires sur la demande, causés par exemple par la température, les conventions, un
dysfonctionnement des autres types de transports en commun... Pour trois bases de données
4
di�érentes, les élasticités salaire de l'o�re estimées sont pratiquement toutes négatives, à la fois
par la méthode des moindres carrés ordinaires (-0.186 à -0.618) et par celle de variable instru-
mentale (0.005 à -1.313). Ainsi, les auteurs obtiennent peu de con�rmation que les chau�eurs
suivent le modèle de comportement néoclassique. Entre autres explications, ils soulignent la
possibilité d'un modèle de comportement avec des préférences de type reference-dependent, où
le travailleur se �xe un objectif de revenu à atteindre.
1.2.2 Chou (2002)
Chou (2002) reprend la conclusion de Camerer et coll. (1997) et tente d'opposer directement les
deux types de modèle en utilisant des données portant sur les chau�eurs de taxi singapouriens.
Les données ont été récoltées par un sondage que l'auteur à lui-même créé. En procédant
ainsi, il évite les problèmes généralement rencontrés dans la littérature. De plus, il lui est
ainsi possible d'obtenir de l'information qui n'est pas directement disponible pour les autres
auteurs, tel que l'expérience du travailleur, l'âge, l'éducation, la taille de la famille... Son
sondage lui permet également d'aborder la question de manière directe auprès des chau�eurs,
en leur posant des questions sur leur comportement de travail lors d'une journée payante.
Comme dans le cas de Camerer et coll. (1997), les résultats obtenus par Chou (2002) pointent
vers le modèle reference-dependent. Que ce soit par MCO (-0.0997 à -0.5850) ou en utilisant
des méthodes de variable instrumentale (-0.1644 à -0.8939), les élasticités estimées sont toutes
négatives. Il démontre également que les chau�eurs ayant déclaré travailler davantage lors de
journées à salaire élevé a�chent des élasticités encore plus négatives que ceux ayant a�rmé
travailler le nombre d'heures habituel.
1.2.3 Crawford et Meng (2011)
L'analyse menée par Crawford et Meng (2011), au contraire des auteurs précédents, ne pré-
sente aucune estimation d'élasticité. Elle suit plutôt l'analyse empirique faite par Farber (2005 ;
2008), qui utilise des modèles probit a�n de déterminer la probabilité d'arrêter de travailler
suite à l'atteinte du point de référence 2. Les auteurs se basent également sur un modèle théo-
rique de préférence reference-dependent proposé par K®szegi et Rabin (2006), où le travailleur
se �xe deux cibles simultanément, l'une en terme de revenu et l'autre en terme d'heures de tra-
vail. Ainsi, travailler davantage que prévu est considéré comme une perte, tout comme le fait
de ne pas atteindre le montant désiré. Dans ce modèle, les points de référence sont déterminés
en tant qu'anticipations rationnelles, sur la base d'une moyenne des jours précédents.
En prenant soin de séparer leurs observations selon que le chau�eur fait face à un salaire plus
ou moins élevé que leur moyenne au début de son quart de travail, les auteurs estiment la
probabilité d'arrêter de travailler selon le nombre d'heures et le montant obtenu. Ils trouvent
2. Je discute ultérieurement de ces deux articles de Farber.
5
que, pour les chau�eurs faisant face à un salaire élevé, seul le nombre d'heures travaillées
a un impact signi�catif. À l'inverse, pour ceux qui observent un salaire plus faible, le seul
impact signi�catif sur la décision d'arrêter vient du revenu. Dans les deux cas, la décision
est davantage in�uencée par le second objectif atteint. Comme Crawford et Meng (2011) le
soulignent, cette inversion dans le comportement s'explique mieux par un modèle de préférence
reference-dependent. La conclusion de leur article est en faveur de ce modèle.
1.3 Les partisans du modèle intertemporel
1.3.1 Farber
Dans son premier papier sur le sujet, Farber (2005) fait le point sur la tension naturelle qui
existe entre les deux modèles. Avec des données de l'an 2000 portant sur les chau�eurs new-
yorkais, il fait ressortir des arguments en faveur du modèle néoclassique. Entre autres, en
utilisant un modèle probit, il démontre que la probabilité qu'un chau�eur décide d'arrêter
de travailler dépend davantage du nombre d'heures travaillées que du montant récolté dans
la journée. En reprenant l'analyse faite par Camerer et coll. (1997), il obtient lui aussi des
élasticités négatives (-0.637), mais souligne, comme l'ont fait les auteurs, que cette estimation
est sujette à un biais négatif 3. Farber argumente également que les salaires à travers une
même journée sont variables, mais qu'ils ne sont pas fortement corrélés d'une heure à l'autre,
ce qui le pousse à croire que ceux-ci ne peuvent être considérés comme un paramètre valide
dans la décision d'o�re de travail d'un chau�eur. Ses résultats contradictoires le poussent à
arguer que cette di�érence de conclusion entre les auteurs dépend des méthodes économétriques
utilisées. Il explore également la question d'hétérogénéité de comportement chez les travailleurs
en répétant son analyse pour chacun des chau�eurs présents dans son échantillon. En�n,
il mentionne avoir e�ectué un sondage informel auprès de plusieurs chau�eurs lors de ses
déplacements dans la ville. Ce sondage, quelque peu analogue à celui mené par Chou (2000),
lui permet d'illustrer le quotidien des chau�eurs.
En utilisant les mêmes données, Farber (2008) propose un autre modèle probit qui admet
l'existence d'un point de référence. Il obtient cette fois que la probabilité d'arrêt, une fois la
cible atteinte, est substantielle. Il trouve cependant, d'un jour à l'autre, une forte variation
dans la cible établie. Il en conclu que le pouvoir prédictif d'un point de référence sur l'o�re de
travail est � vraisemblablement très limitée �et que d'avantages de recherches sont nécessaires.
Farber (2015) réplique et allonge à nouveau l'analyse de Camerer et coll. (1997). Il se base
cette fois lui aussi sur un modèle de préférences reference-dependent avec anticipations ra-
tionnelles inspiré par celui de K®szegi et Rabin (2006). Il utilise un sous-échantillon d'une
3. Dans ces deux articles, la variable utilisée en guise de salaire horaire est calculée en prenant le revenud'un quart de travail et en le divisant par le nombre d'heures travaillées. Cette problématique sera abordéedans la section méthodologie et résultat.
6
base de données portant sur les chau�eurs new-yorkais, couvrant l'entièreté des années 2009
à 2013. Au contraire des autres études, il évite ainsi une faiblesse récurrente relativement aux
petits échantillons. Les résultats de son étude donnent à nouveau raison au modèle néoclas-
sique intertemporel. Farber distingue les variations de salaire selon qu'elles sont prévisibles ou
non et argumente qu'un modèle reference-dependent ne peut qu'expliquer une petite partie du
comportement d'o�re chez les travailleurs 4. En utilisant encore une fois un modèle de choix
discret pour estimer la probabilité d'arrêter de travailler, il rapporte que celle-ci est forte-
ment in�uencée par le nombre d'heures travaillées et, au mieux, faiblement par le revenu. Les
élasticités salaire estimées par Farber sont comprises entre 0.3672 et 0.8751 5.
Il tente à nouveau de déterminer si les deux types de comportement sont présents dans ses
données, mais n'en trouve que des preuves faibles. Il démontre en�n que les chau�eurs tendent
à devenir de meilleurs optimisateurs, c'est-à-dire à se comporter davantage selon le modèle
intertemporel, à mesure qu'ils gagnent en expérience. Aussi, les chau�eurs inexpérimentés qui
a�chent de faibles élasticités ont plus tendance à quitter l'industrie.
4. Comme je le mentionne dans la section suivante, une variation de salaire qui est prévisible pourra inciterle travailleur à revoir à la hausse son objectif de revenu. Farber trouve que seulement 1/8 des variations desalaire sont imprévisibles.
5. Pour ses régressions par variable instrumentale, avec contrôle et une fois les e�ets �xes considérés.
7
Chapitre 2
Les modèles en opposition
J'ai fait mention, à travers le chapitre précédent, des modèles de comportement d'o�re de
travail intertemporel et reference-dependent. Dans ce chapitre, je les explique plus en détail et
tente ainsi de démontrer le con�it naturel qui existe entre eux.
2.1 Le modèle intertemporel
Ce premier modèle est un cas ra�né du modèle de base en économie, où l'on permet la
projection dans le temps. Suivant celui-ci, on suppose que l'individu cherche à maximiser sa
fonction d'utilité sous une contrainte de richesse, le tout sur son horizon de vie. Ce faisant, il
plani�e donc sa consommation et ses heures de loisir (dé�ni comme le temps qui n'est pas passé
à travailler) pour chaque période de sa vie. A�n d'obtenir des résultats analytiques simples et
aisément interprétables, la forme fonctionnelle de l'utilité est souvent spéci�er comme étant
intertemporellement séparable, telle que 1 2 :
U =
T∑t=0
[G(Ct) + J(Lt)
]1
(1 + ρ)t
1. Cette hypothèse est toutefois restrictive dans la mesure où elle ne permet pas de prendre en considérationles habitudes de consommations de l'agent. Autrement dit, la consommation à une période donnée n'a�ectepas l'utilité d'une autre période.
2. De plus, la forme proposée ici est également séparable d'une manière intratemporelle, c'est-à-dire qu'onne permet pas la présence d'une complémentarité entre la consommation et le loisir pour une période donnée.
8
Où : U représente l'utilité totale ;
t représente l'indice de temps ;
G(Ct) est l'utilité instantanée de la consommation ;
Ct est le niveau de consommation au temps t;
J(Lt) représente l'utilité instantanée du loisir au temps t;
Lt est le nombre d'heure de loisir au temps t;
ρ représente le taux de préférence pour le présent.
Et où : G′(Ct) > 0 ; G′′(Ct) < 0
J ′(Lt) > 0 ; J ′′(Lt) < 0.
La contrainte de richesse quant à elle est représentée par l'expression suivante 3 :
A0 −T∑t=0
1
(1 + r)t
[Ct − st(1− Lt)
]≥ 0
Où : A0 représente la valeur des actifs de l'agent à la période initiale ;
r représente le taux d'intérêt réel du marché (constant par hypothèse) ;
st représente le salaire horaire de l'agent à la période t.
Cette dernière stipule simplement que la valeur de la consommation faite par l'individu au
courant de sa vie doit être au plus égale à sa richesse initiale plus son revenu de travail. Pour
simpli�er, on considère que l'agent ne touche aucun revenu hors travail. En�n, pour chaque
période, l'agent doit faire face à une contrainte de temps : 1 − Lt ≥ 0 (le temps total étant
normalisé à 1). Le Lagrangien du programme de maximisation de l'agent est donc représenté
par l'équation suivante :
L =
T∑t=0
(G(Ct) + J(Lt)
)1
(1 + ρ)t+ λ0
(A0 −
T∑t=0
1
(1 + r)t[Ct − st(1−Lt)
])+
T∑t=0
µt[1−Lt
]où λ0 et µt sont des multiplicateurs de Lagrange et s'interprètent respectivement comme étant
l'utilité marginale de la richesse et l'utilité marginale du travail au temps t. De celle-ci, on
3. A�n de simpli�er l'exposé, je présente ici une version du modèle où l'agent est en situation de certitudequant au futur. L'interprétation reste toutefois la même.
9
obtient les conditions de premier ordre (C.P.O.) suivantes pour t= 0, . . . , T :
δLδCt
=G′(Ct)
(1− ρ)t− λ0
(1 + r)t= 0
δLδLt
=J ′(Lt)
(1− ρ)t− stλ0
(1 + r)t= 0
δLδλ0
= A0 −T∑t=0
[Ct − st(1− Lt)](1 + r)t
= 0
δLδµt
= T − Lt ≥ 0
µt ≥ 0 ; µt[1− Lt
]= 0
Selon ce modèle, une augmentation de salaire entraine deux e�ets distincts sur la décision
d'o�re de travail, soit un e�et de substitution et un e�et de richesse. L'e�et de substitution
re�ète l'e�et d'un changement dans le rapport des prix sur la demande d'un bien, tel que le
niveau d'utilité reste constant. Dans le modèle néoclassique dynamique tel que celui-ci, il existe
deux types d'e�ets de substitution, soit celui à l'intérieur d'une période (intratemporel) et celui
entre les périodes (intertemporel). L'e�et intratemporel s'observe directement en prenant le
rapport entre les deux premières C.P.O sur une même période t. Celui-ci nous indique le taux
auquel l'agent acceptera d'échanger du loisir contre de la consommation à cette période (pour
une solution intérieure où µt = 0). On le dénote :
TMSintra = st =J ′(Lt)
G′(Ct).
Le salaire étant le prix d'une heure de loisir, une augmentation de celui-ci incite le travailleur
à diminuer sa demande d'heure de loisir. De façon équivalente, l'augmentation de salaire rend
le travail plus attrayant et incite à augmenter l'o�re de travail 4.
2.1.1 Variations transitoires et permanentes des salaires
A�n de rendre lisse son niveau de consommation entre les di�érentes périodes de sa vie,
le travailleur a la possibilité de substituer le nombre d'heures travaillées entre celles-ci. Par
exemple, sachant qu'il sera un jour à la retraite, l'agent pourra prendre la décision de travailler
davantage et de consommer moins lors de sa vie active pour en tirer pro�t lors de ses vieux
jours, tout en conservant un niveau de consommation relativement constant. À travers les
lignes suivantes, je tente d'illustrer par quel mécanisme le modèle intertemporel tient compte
des changements dans l'o�re de travail lors d'une variation de salaire entre les périodes.
4. Il est toutefois important de noter que ce résultat est une conséquence directe de l'hypothèse de sépara-bilité intertemporelle l'utilité.
10
Toujours avec les deux premières C.P.O., il est possible de tirer directement les fonctions de
demande de consommation et de loisir, respectivement formulées :
Ct = G′−1
([(1− ρ)
(1 + r)
]tλ0
); Lt = J ′−1
([(1− ρ)
(1 + r)
]tλ0st
).
La dé�nition d'une heure de loisir implique que l'o�re de travail dépend des mêmes paramètres
et est formulée telle que :
Ht = 1− Lt = 1− J ′−1
([(1− ρ)
(1 + r)
]tλ0st
).
On constate aisément que ces fonctions dépendent de l'utilité marginale de la richesse λ05.
Ce paramètre peut être perçu comme étant une statistique exhaustive résumant l'e�et des
variables monétaires des autres périodes 6. Pour s'en convaincre, il su�t de remplacer les
fonctions de demande de consommation et de loisir dans la troisième C.P.O. pour obtenir
l'expression (implicite) de λ0 suivante :
A0 −T∑t=0
1
(1 + r)t
[G′−1
([1− ρ1 + r
]tλ0
)− st
(1− J ′−1
([1− ρ1 + r
]tλ0st
))]= 0.
Ainsi, les demandes de consommations et de loisir, de même que l'o�re de travail, sont a�ec-
tées par les salaires passés et futurs seulement à travers λ0. C'est l'e�et richesse mentionné
plus tôt. On peut voir que, pour un horizon T su�samment large, une augmentation de salaire
n'a�ectant qu'une seule période (variation transitoire) n'aura pratiquement pas d'in�uence sur
λ0 puisque son importance sera négligeable. Par contre, cette augmentation a�ectera directe-
ment et positivement l'o�re de travail pour la période en question. Inversement, dans le cas
d'une augmentation permanente du pro�l des salaires, l'utilité marginale de la richesse sera
plus fortement a�ectée. Si tous les salaires augmentent d'une même proportion, λ0 sera divisée
d'autant. Au niveau de l'o�re de travail au temps t, l'e�et de la variation de λ0 annulera celui
du salaire st.
En résumé, dans la mesure où le loisir est considéré comme un bien normal, l'e�et richesse incite
l'agent à revoir son o�re de travail à la baisse suite à une augmentation de salaire. Des e�ets
richesse et substitution, l'un sera dominant et in�uencera le nombre d'heures de travail o�ertes.
Selon que l'augmentation est permanente ou temporaire, l'e�et dominant sur la décision des
heures travaillées peut être di�érent. Dans le cas d'une augmentation permanente et égale pour
toutes les périodes, les deux e�ets sont présents et s'annulent. S'il s'agit au contraire d'une
5. Par conséquent, il ne s'agit pas ici de fonctions de demande classiques.6. Par variables monétaires, j'entends surtout les salaires, mais également les taux d'intérêts et de préférence
pour le présent.
11
augmentation transitoire, l'e�et richesse sera généralement négligeable et l'e�et substitution
dominera, entrainant une augmentation de l'o�re de travail.
Lors de l'estimation d'une fonction d'o�re de travail, considérer λ0 comme une constante
revient à se poser dans une perspective de variation de salaire transitoire, tel que précédemment
décrit. Ce type d'o�re porte le nom d'o�re de travail frischienne 7.
2.2 Le modèle reference-dependent
Ce modèle alternatif souvent proposé dans la littérature prend son origine dans la théorie de
l'individu averse à la perte 8. Il s'agit également d'un modèle de maximisation d'utilité, mais
pour lequel la fonction qui est maximisée contient au moins une composante qui est évaluée
relativement à un point de référence subjectif à l'individu.
L'aversion à la perte se traduit, au niveau de la fonction d'utilité, par une valeur associée aux
pertes plus élevée (en absolu) par rapport aux gains. Dit autrement, |f(−x)| > |f(x)|. Ainsi, ladésutilité ressentie par l'individu qui se trouve sous son point de référence d'un montant x sera
supérieure à l'utilité de dépasser ce même point par un montant x. On considère également
que la sensibilité de l'individu face aux gains et aux pertes est généralement décroissante.
Contrairement à l'hypothèse très semblable d'utilité marginale décroissante, celle-ci n'implique
notamment pas que la fonction d'utilité soit concave sous le point de référence.
Cependant, le contexte auquel je désir appliquer ce modèle nécessite un ajustement de la fonc-
tion d'utilité. Soit un travailleur qui se �xe une cible en terme de revenu. Même si celle-ci
n'est pas atteinte, le travailleur retirera tout de même une certaine dose d'utilité de sa rému-
nération. C'est pourquoi il est nécessaire d'ajouter à cette fonction une composante � utilité
de consommation �qui attribue une valeur à ce montant. La représentation graphique devient
maintenant plus familière, semblable à la �gure 2.1, où I, T , L et w sont respectivement le
revenu, le point de référence, les heures de loisir et le salaire 9.
Formellement, tel que le fait Farber (2015), il est possible de représenter l'utilité d'un tel
travailleur par la fonction suivante :
U(h) =
a(wh− T )− h1+σ si wh− T < 0
b(wh− T )− h1+σ si wh− T ≥ 0
7. Dans la mesure où λ0 est constant, mais di�ère d'un travailleur à l'autre, l'estimation adéquate desparamètres d'une fonction frischienne nécessite de prendre en compte la présence d'e�ets �xes (MaCurdy,1981).
8. Voir Kahneman and Tversky (1979) et Tversky et Kahneman (1991)9. La �gure représente le cas linéarisé a�n de facilité la distinction par rapport à la fonction d'utilité usuelle.
Cela est équivalent à relâcher l'hypothèse de sensibilité décroissante.
12
U(I)
IT
I
L
U1
T
w
Figure 2.1 � Fonction d'utilité et courbre d'indiférence reference-dependent linéarisé.
où I = wh est le revenu, T est l'objectif de l'individu en terme de revenu, w est le salaire
horaire, h est le nombre d'heures travaillées, a > b > 0 sont des coe�cients qui servent à
contrôler l'utilité marginale avant et après l'atteinte de l'objectif et σ > 0 est un paramètre
a�ectant l'élasticité salaire de l'o�re. Les prédictions du modèle reference-dependent sont les
suivantes 10 :
� Si I − T < 0 l'équation d'o�re de travail est donnée par
h∗ =( aw
1 + σ
) 1σ
et l'élasticité salaire de l'o�re est
1
σ> 0.
Cela implique qu'à de faibles niveaux de salaire, c'est-à-dire des salaires qui ne per-
mettent pas au travailleur d'atteindre son objectif à l'intérieur d'une période de travail
donnée, ce dernier se comporte de manière similaire au modèle intertemporel. Ainsi,
une augmentation de salaire temporaire dans cet intervalle se traduit par une augmen-
tation de l'o�re de travail. Si l'on se pose dans le contexte d'un chau�eur de taxi, ce
modèle prédit que le chau�eur sillonnera les rues de la ville, peinant à trouver des
clients, jusqu'à ce qu'il décide que le salaire n'en vaille plus l'e�ort.
10. Voir l'annexe 1 pour les développements complets.
13
� Si I − T = 0 l'o�re de travail est donnée par
h∗ =T
w
et l'élasticité salaire de l'o�re est égale à -1.
Aussitôt que le salaire est assez élevé pour atteindre sa cible, le chau�eur travaillera
jusqu'à l'atteinte de celle-ci mais pas davantage. Ce dernier se comporte ainsi sur un
certain intervalle de salaire. Dans cet intervalle, il considère le salaire plus élevé que la
valeur qu'il accorde à une heure de loisir, mais considère également qu'il ne vaut pas la
peine de travailler davantage. Cela implique qu'une augmentation de salaire contenue
dans cet intervalle entrainera une diminution de l'o�re de travail, puisque l'objectif est
atteint de plus en plus rapidement.
� Si I − T > 0 l'o�re de travail est donnée par
h∗ =( bw
1 + σ
) 1σ
et l'élasticité salaire est à nouveau égale à
1
σ> 0.
Ici la seule di�érence avec le cas Y − T < 0 est la substitution des paramètres a et b.
Comme ce sont deux paramètres positifs, les prédictions sont essentiellement les mêmes.
Ainsi, lorsque le salaire se trouve à des niveaux supérieurs, le travailleur recommence à
avoir un comportement similaire au modèle intertemporel. À ces niveaux, le chau�eur
atteindra sa cible rapidement et à ce point réalisera que son salaire est au moins égal
au montant pour lequel il serait prêt à continuer de travailler. Ainsi la relation entre
heures travaillées et salaire redevient positive.
Économiquement, cette structure à trois intervalles peut sembler curieuse. Il s'agit ici des
prédictions mathématiques du modèle. Pour que celles-ci tienne la route, il serait nécessaire
de poser des hypothèses supplémentaires, à savoir, que le chau�eur �xe son objectif avant
de commencer à travailler et que celui-ci ne puisse être modi�é une fois qu'il a commencé à
travailler. Supposons un chau�eur en présence d'un salaire en dessous de ses attentes, qui ne
lui permet pas d'atteindre sa cible. Ce dernier cherchera à minimiser la désutilité associée au
fait de manquer sa cible et travaillera jusqu'à ce que cela lui soit trop pénible. Si au contraire
on permet au travailleur de réviser sa cible, alors celui-ci devrait logiquement la déterminer
de façon à ce qu'elle soit atteignable avec le taux horaire qu'il observe. En procédant ainsi, il
se trouvera à l'endroit où l'élasticité salaire de l'o�re est négative.
14
Comme je l'ai mentionné plus tôt dans la revue de littérature, les points de référence des
chau�eurs sont déterminés selon le principe des anticipations rationnelles. Plus précisément,
cette cible serait basée sur le revenu espéré, lui-même fonction de l'espérance des salaires
précédents et du nombre d'heures que le chau�eur désire travailler à ce niveau de salaire.
Il est donc important de mentionner que cette structure de comportement n'est valide que
pour les variations de salaires qui sont imprévisibles et temporaires. En e�et, si le travailleur
est au fait d'un évènement futur quelconque qui aura un impact sur son salaire, celui-ci sera en
mesure de �xer une cible en conséquence, ce qui aura potentiellement sur son o�re de travail
un e�et similaire au modèle intertemporel. En�n, pour que la relation négative puisse être
observée, les variations de salaire doivent se trouver relativement près du point de référence, au
risque d'amener le travailleur dans l'une des � zones intertemporelles �. Ainsi, ces nombreuses
conditions font en sorte que l'intervalle de salaire dans lequel le modèle reference-dependent
est pertinent devient relativement court (Farber 2015).
2.3 Distinction des modèles
En résumé, le modèle intertemporel prédit une augmentation de l'o�re de travail suite à
une variation temporaire du salaire. À l'opposé, le modèle reference-dependent prédit qu'une
diminution de l'o�re sera causée par une augmentation temporaire et imprévue du salaire,
dans la mesure où celle-ci se situe dans un certain intervalle autour du point de référence de
l'individu. Puisque, comme les études présentées plus tôt, je cherche à déterminer lequel de ces
deux modèles explique le mieux le comportement des chau�eurs de taxi, il me faut trouver une
source de variation de leur salaire qui soit temporaire et imprévisible. Par conséquent, je retiens
les conditions météorologiques comme causes de telles variations. Celles-ci sont évidemment
temporaires et, comme je le véri�e dans la section des résultats, l'ampleur de leur impact sur
le niveau de salaire est relativement imprévisible. Je fais l'hypothèse que le mauvais temps
entraine une hausse dans la demande de services de taxi. Cette hausse de demande se traduit
pour les chau�eurs par une plus grande aisance à trouver des opportunités de courses. Comme
un chau�eur tire son revenu du nombre de courses qu'il e�ectue, il s'ensuit pour lui une
augmentation de revenu. Ce montant divisé par le nombre d'heures travaillées sera ma mesure
pour le salaire.
Au �nal, si les chau�eurs se comportent conformément au modèle intertemporel, ils répondront
aux mauvaises conditions météorologiques en travaillant plus longtemps. Si au contraire le mo-
dèle reference-dependent est celui qui est suivi, les chau�eurs diminueront la quantité d'heures
travaillées lors de journées pluvieuses (à condition de se trouver dans l'intervalle pertinent).
15
Chapitre 3
Les données
Dans ce chapitre, je discute des données utilisées a�n de départager les deux modèles. J'y
décris les manipulations e�ectuées pour en faire le nettoyage. Je décris ensuite les données de
façon sommaire. Je termine en expliquant les raisons derrière l'utilisation de ces données.
3.1 Source et manipulations
A�n de réponde à ma question de recherche, j'utilise une base de données portant sur l'industrie
du taxi new-yorkais. Ces données sont disponibles directement sur le site internet de la Taxi
and Limousine Commission (TLC) de la ville de New York, qui est l'agence gouvernementale
municipale en charge de réguler l'industrie 1. Créée en 1971, la commission a comme rôles
principaux de délivrer les permis nécessaires, �xer les tarifs et procéder à l'inspection des
véhicules.
Au moment d'écrire ces lignes, les données disponibles couvrent la totalité des courses e�ec-
tuées pour les années 2009 à 2015. Elles contiennent de l'information sur l'endroit ainsi que
la date exacte de départ et d'arrivée, la distance parcourue, le tarif en vigueur ainsi que le
nombre de passagers (rapporté par le chau�eur). Pour chaque course, le numéro de licence du
chau�eur est disponible. Vu l'importante taille de ces données, je restreins mon analyse sur
les 168 793 839 courses e�ectuées au cours de l'année 2013.
Ces données sont récoltées et colligées de manière électronique à travers les compteurs présents
à l'intérieur de chaque taxi, pour le compte de la TLC. Comme c'est souvent le cas, et bien que
le processus de récolte d'information soit automatisé, mes données sous leur forme brute ren-
ferment certaines incongruités. Par exemple, certaines observations montrent des courses dont
les points de départ ou d'arrivée se retrouvent en pleine mer. D'autres encore se feraient à des
vitesses largement supérieures aux limites légales. Quelques chau�eurs, à l'image d'un numéro
1. Nous sommes redevables de l'accessibilité publique de ces données à M. Christopher M. Whong, qui en2014 en a fait la demande auprès de la commission sous le couvert de la Freedom of Information Law
16
de cirque, auraient réussi à entasser au-delà de 200 passagers dans leur véhicule. Quoique dans
plusieurs cas le reste des informations soient raisonnables, ces incongruités démontrent que les
procédés technologiques ne sont pas infaillibles. Pour cette raison, je procède au nettoyage des
données en leur imposant certaines conditions logiques.
En utilisant l'information sur les points de départ et d'arrivée, qui suivent le système GPS,
je restreins la localisation d'une course à l'intérieur du territoire américain, à l'exception de
l'État d'Alaska. Toutes courses lors desquelles le rapport de distance/temps dépasse la limite
de 85miles (136,8 km) par heure est écartée 2. Toute observation pour laquelle le nombre de
passagers est supérieur à 30 est retirée, ce qui permet de conserver les cas particuliers où le
véhicule est une limousine 3. En�n, est supprimée toute course qui a�che un tarif négatif ou
qui se termine plus tôt qu'elle ne débute.
Une fois le nettoyage e�ectué, ma base de données, sous sa forme où chaque observation repré-
sente une course, contient 167 951 567 observations. Ce sont donc 0,5% des données qui ont été
supprimées. J'ajoute ensuite à ma base de données de l'information sur la température, colli-
gée par le Network for Environment and Weather Applications (NEWA) 4. Le NEWA est un
réseau de stations météorologiques réparties dans le nord-est des États-Unis, qui enregistrent
des données à toutes les heures. La station consultée est NYC-Central Park. À chacune des
courses donc, sur la base de son heure de départ, est associées la température (°F), le taux de
précipitation de pluie (mm/h) ainsi que la vitesse du vent (km/h) correspondante.
Dans le tableau 3.1, je présente un sommaire des variables continues de ma base de données.
En utilisant l'information relative aux dates précises lors desquelles les courses sont e�ectuées,
je suis en mesure de connaître le mois, le jour et le moment de la journée pour chacune de
ces observations. Cela me permet également d'identi�er les jours de fête les plus susceptibles
d'avoir un impact sur les déterminants du marché. La distribution des courses dans le temps,
selon chacune de ces catégories, est présentée dans le tableau 3.2. Par exemple, 13.23% des
courses e�ectuées en 2013 ont débuté un lundi ; 9.09% lors du mois de mars, 0.27% lors de la
journée du Super Bowl et 12,87% ont commencé la nuit 5.
Puisque mon intérêt porte sur l'o�re de travail chez les chau�eurs, j'aurai également besoin
d'une base de données contenant de l'information sur la durée des périodes travaillées. Je
dé�nis donc, pour chaque chau�eur, un quart de travail comme étant une période de travail
2. Il s'agit ici de la limite légale la plus élevée, tous États confondus. Elle correspond à celle du Texas surla grande route interÉtats en milieu rural.
3. Comme en témoigne le site internet de la TLC, il existe une o�re de service relative aux limousines. Leclient doit en faire le préarrangement auprès d'une compagnie spécialisée. La limite de 30 a été retenue sur labase des produits o�erts par ces di�érentes compagnies. Toutefois, il semblerait que le groupe de client le plusnombreux pour l'année étudiée ait été composé de 9 personnes.
4. Le NEWA a été fondé en 1995 par le New York State Integrated Pest Management (IPM) et est �nancé,à travers celui-ci, par l'État de New York et la Cornell University (entre autres).
5. Je sépare une journée en quatre périodes de 6 heures, avec la nuit commençant à 00h00 et terminant à6h00
17
Table 3.1 � Description des données sous forme par course
Variables Moyenne Écart-Type Min. Max.Nombre de passagers 1.711 1.3759 1 9Temps (min) 12.64 9.35 0.02 332Distance (km) 4.673 5.415 0 365.882Prix total ($) 14.75 11.84 0 600Température (°F) 55.37 17.79 11 97Pluie (mm/h) 0.144 0.9874 0 26.924Vitesse du vent (km/h) 9.361 6.077 0 44.418
Table 3.2 � Distribution des courses selon le temps
Jour PériodeLundi 13.23 %Mardi 14.26 %
Mercredi 14.42%Jeudi 14.74%
Vendredi 15.22%Samedi 15.15%
Dimanche 12.97%
Matin 24.06 %Après-midi 28.42 %
Soir 34.66 %Nuit 12.87 %
Fêtes Mois
Nouvel An 0.24%Super Bowl 0.27%
Saint-Valentin 0.3%Pâque 0.26%
Jour du souvenir 0.19%4 juillet 0.19%
Fête du travail 0.19%Action de Grâce 0.19%
Noël 0.14%Veille du jour de l'an 0.27%
Janvier 8.51 %Février 8.06 %Mars 9.09 %Avril 8.73 %Mai 8.51 %Juin 8.32 %
Juillet 8.03 %Août 7.34 %
Septembre 8.23 %Octobre 8.75 %
Novembre 8.33 %Décembre 8.1 %
d'une durée d'au moins 30 minutes, séparée d'une autre par au moins 6 heures sans qu'aucune
course ne soit e�ectuée. À partir de cette dé�nition (empruntée à Farber(2015)), il m'est
possible de transformer les données sous leur forme par course pour les avoir par quart de
travail. Sous cette forme, je possède de l'information sur le nombre de courses e�ectuées, le
temps total passé avec un client, la distance totale parcourue avec un client, le revenu total
des courses e�ectuées ainsi que la moyenne de la température, de la vitesse du vent et des
précipitations. La durée du quart est quant à elle calculée comme étant la di�érence entre la
date de �n de la dernière course et la date de début de la première 6. Le tableau 3.3 présente
6. Pour pouvoir travailler avec les variables de temps, Stata attribue un nombre entier à chaque milliseconde.
18
de l'information sur la distribution de ces variables.
Table 3.3 � Description des données sous forme par quart
Variables Moyenne Écart-Type Min. Max.Durée du quart (h) 8.51 3.34 0.5 199.99Nombre de courses 21.59 9.464 1 476Nombre de passagers 36.955 34.396 1 2061Temps total avec client (min) 272.31 108.1 0.05 8 438Distance totale avec client (km) 100.95 43.185 0 3168.21Revenu total des courses ($) 318.21 122.46 0.01 8757.04Précipitation moyenne (mm/h) 0.1379 0.5637 0 26.92Vitesse du vent moyenne (km/h) 9.1539 4.3651 0 44.4178Température (°F) 56.5638 17.7413 11 97
3.2 Pourquoi l'industrie du taxi ?
L'utilisation de données portant sur le marché du taxi new-yorkais s'explique par la composi-
tion de l'industrie. Les taxis jaunes iconiques de la ville, seuls autorisés à prendre des clients
les ayant hélés dans les rues de Manhattan, se divisent selon deux types de médaillons 7. Les
� médaillons de �otte �identi�ent les taxis appartenant à une sorte de garage et qui sont loués
à des chau�eurs possédant eux-mêmes une licence. Pour ce type de médaillon, le propriétaire
doit en posséder au minimum deux et chacun de ceux-ci doit être en activité pendant au moins
neuf heures, deux fois par jour. L'autre type, les médaillons indépendants, sont quant à eux
attribués individuellement. Le propriétaire de ce type de médaillon a lui aussi la possibilité
d'en faire la location auprès d'un chau�eur.
L'entente généralement établie entre le propriétaire et le locataire est que les frais de la période
de location sont avancés par ce dernier. Une fois ces frais et le coût de l'essence encourus,
le locataire peut conserver la totalité du revenu des courses e�ectuées. Ainsi, qu'ils soient
propriétaires ou non, les chau�eurs internalisent les coûts de production et sont libres de
décider du nombre d'heures qu'ils travaillent 8. Il s'agit donc d'un cadre idéal a�n de tester
des modèles de comportement d'o�re de travail qui se base sur une maximisation d'utilité
(Chou 2002, Farber 2015).
Le point de référence étant le 1er janvier 1960, la valeur de 0 lui est attribuée. Ainsi, une di�érence de dateest équivalente au temps écouler depuis le temps 0.
7. Un médaillon étant une sorte de licence attachée au taxi8. On ne les voit pas contraints de respecter un certain nombre d'heures par semaine. Les primes associées
aux heures supplémentaires, souvent source de réticence chez les employeurs, ne sont pas présentent dans cetteindustrie.
19
3.3 Sur l'utilisation de grandes bases de données
Bien que l'utilisation d'un échantillon d'aussi grande taille apporte une meilleure précision
aux estimations, celle-ci entraine également quelques complications. En plus de l'intensité
des calculs, l'une des principales complications vient des méthodes d'inférences statistiques,
généralement utilisées sur des échantillons de petite taille, qui peuvent mener à des conclusions
trompeuses ou inexactes (Lin, Lucas et Shmueli 2013). Entre autres, un problème connu sous
le nom de � problème de la p-value �, où on attribue une signi�cativité à des e�ets in�mes,
est souvent rencontré. A�n de se garantir des pièges causés par ce phénomène, Lin, Lucas et
Shmueli (2013) proposent plusieurs solutions simples.
Parmi celles-ci, les auteurs recommandent aux chercheurs d'être textuellement clairs quant à
l'interprétation des paramètres et des e�ets estimés. Autrement dit, les chercheurs ne devraient
pas simplement s'attarder au signe et au niveau de signi�cativité du paramètre, mais également
à l'ampleur de celui-ci. De plus, ils recommandent de rapporter ces e�ets en spéci�ant un
intervalle de con�ance. Ceci a deux avantages. Le premier est que contrairement à la p-value
qui indique seulement la probabilité de rejeter l'hypothèse nulle sans se tromper, l'intervalle de
con�ance donne une meilleure idée de l'ampleur de l'e�et estimé. Le second avantage est qu'il
devient bien plus facile de comparer les résultats entre les di�érentes études, faire la synthèse
de celles-ci et ainsi contribuer à l'avancement des connaissances. Le reste des suggestions des
auteurs impliquent principalement des représentations graphiques servant à illustrer l'évolution
des estimations à mesure que la taille de l'échantillon augmente.
Ainsi, je devrai rester prudent lors de l'interprétation de mes résultats. Pour me prémunir
le plus possible des problèmes associés à la grande taille de ma base de données, j'essaierai
d'appliquer au mieux possible les principales recommandations de cette étude.
Une autre alternative simple, proposée entre autres par Greene(2003), serait de simplement
diminuer, à mesure que la taille de l'échantillon augmente, le seuil auquel on admet la si-
gni�cativité. Par contre, cette méthode reste très subjective et il n'existe aucune règle pour
déterminer ce seuil (Lin, Lucas et Shmueli 2013).
20
Chapitre 4
Méthodologie et résultats
Dans ce chapitre, je présente les résultats de mes estimations, en expliquant au passage la
méthodologie utilisée. Je débute par la véri�cation des hypothèses relativement au contexte
proposé par Camerer et coll. (1997). J'estime ensuite l'importance que peut prendre le modèle
reference-dependent dans l'explication du comportement d'o�re de travail chez les chau�eurs
de taxi. J'enchaîne en observant comment se comporte le marché lors d'un épisode de mauvaise
température. Vient ensuite l'estimation d'élasticités salaire de l'o�re, en tenant compte d'un
problème d'endogénéité.
4.1 Véri�cation d'hypothèses
4.1.1 Autocorrélations des salaires
Comme je le mentionne dans ma revue de littérature, Camerer et coll. (1997) suggèrent l'uti-
lisation d'un contexte où le salaire horaire est relativement constant à travers les heures d'une
même journée et n'est pas corrélé d'une journée à l'autre. Je m'assure donc ici que c'est bel
et bien le cas.
Dans un premier temps, je véri�e l'autocorrélation des salaires à travers les heures d'une même
journée. Pour ce faire, je calcule d'abord le salaire horaire médian à chacune des heures de
l'année. J'observe ensuite le coe�cient de corrélation linéaire entre les salaires médians des
heures i et i−1, dont la valeur est de 0,86. Cette valeur, positive et proche de 1, indique que la
relation du salaire médian avec lui-même à l'heure précédente s'approche d'une droite de pente
unitaire positive. Par conséquent, cela nous indique que si le salaire médian à l'heure i − 1
est par exemple de 15$, une heure plus tard celui-ci sera toujours autour de 15$. Autrement
dit, le salaire horaire est en e�et relativement constant d'une heure à l'autre (ou à travers
la journée). L'importance de véri�er cette autocorrélation vient du fait que, si celle-ci est
négative, un chau�eur suivant le modèle néoclassique se comportera de telle manière qu'il
dérogera des prédictions du modèle. En e�et, si celui-ci observe un salaire élevé au début de
21
son quart de travail, il arrêtera tôt, sachant que les salaires à venir seront vraisemblablement
faibles. Inversement, constatant un faible salaire en début de journée, il travaillera longtemps,
s'attendant à des salaires élevés éventuels. Puisque la corrélation que j'observe est forte et
positive, je peux écarter cette possibilité.
A�n de véri�er le niveau d'autocorrélation des salaires d'une journée à l'autre, je procède de
manière similaire. Je calcule d'abord la médiane des salaires médians pour chaque jour de mon
échantillon, pour ensuite véri�er le coe�cient de corrélation entre les jours j et j−1. La valeur
obtenue de 0,57 m'indique que, bien qu'elle ne soit pas particulièrement forte, il existe tout
de même une corrélation linéaire entre les salaires d'un jour à l'autre. Ainsi, il semble que les
variations de salaires dont sont témoins les chau�eurs ne soient pas totalement transitoires.
Toutefois, cette faible corrélation s'explique certainement en partie par une sorte d'e�et de
cycle dans les jours de la semaine et en admettant ceci, il ne me semble pas totalement absurde
de croire que le contexte d'un chau�eur de taxi puisse être utilisé a�n de tester le comportement
d'un travailleur suite à une variation temporaire de son salaire.
4.1.2 Mesure de l'importance du modèle Reference-Dependent
Comme je le mentionne dans ma présentation des modèles, le comportement associé au modèle
reference-dependent, soit la diminution de l'o�re de travail suite à une augmentation du salaire,
n'est valide que pour les variations imprévisibles. Si par exemple le chau�eur est en mesure de
prévoir l'amplitude d'une augmentation, il lui sera possible de se �xer une cible plus élevée.
Il y a donc une possibilité de confusion entre les deux modèles. A�n de constater dans quelle
proportion le modèle alternatif peut expliquer le comportement des chau�eurs, je tente de
mesurer la capacité de prédiction des variations de salaire de ces derniers.
Pour ce faire, j'utilise mes données sous une forme où chaque observation représente une heure
de l'année. Je procède avec une simple régression par moindres carrés ordinaires (MCO) du
revenu moyen des chau�eurs dans l'heure sur des variables de température et des indicatrices
de temps. Les variables de température incluent les précipitations de pluie, la vitesse du vent,
l'interaction de celles-ci ainsi que la température. Les variables de temps quant à elles indiquent
la période du jour, le jour de la semaine, le mois et les jours de fête.
De cette régression, on peut tirer le coe�cient de détermination ajusté (ou R2), valeur située
en 0 et 1 qui donne la mesure du pouvoir explicatif du modèle. Dans cette application, cette
valeur s'interprète donc comme la capacité du chau�eur à prédire les salaires horaires à venir.
Comme 0 < R2 < 1, il s'en suit que 1 − R2 donne la mesure d'imprévisibilité. La régression
me donne un R2 = 0, 028, ce qui implique donc que 1 − R2 = 0, 972. Ainsi, près de 97% de
la variation des salaires est imprévue par les chau�eurs. Conséquemment, le comportement
d'o�re de travail chez les chau�eurs de taxi new-yorkais peut s'expliquer dans une même
22
proportion par le modèle reference-dependent. 1
4.2 Les réactions du marché face à la pluie
Avant d'enchaîner avec l'estimation d'élasticités salaire de l'o�re de travail, j'analyse le com-
portement des di�érentes caractéristiques du marché lorsque celui-ci vit un épisode de mauvais
temps. En prenant comme point de départ mes données sous leur forme où chaque observation
représente une course, je transforme celles-ci pour les avoir sous une forme où chaque observa-
tion représente une heure de l'année. Il m'est ainsi possible d'observer pour chaque heure : le
salaire horaire ; le temps moyen (en minutes) passé avec un client à bord par les chau�eurs ; la
distance moyenne parcourue (en km) avec un client ; le nombre de courses e�ectué ainsi que
le nombre de taxis sur les routes.
A�n de mesurer la variation de chacune de ces caractéristiques, j'ai encore une fois recours
à la méthode de régression par MCO. Dans tous les cas, les variables explicatives sont mes
données de température. Je regarde également, en utilisant mes données sous leur forme où
chaque observation représente un quart de travail, l'e�et de ces variables sur la durée moyenne
de celui-ci. En�n, les variables expliquées sont toutes en logarithmique, ce qui me donne des
semi-élasticités. Les résultats de ces di�érentes régressions, avec et sans contrôle pour le temps,
sont respectivement rapportés dans les tableaux 4.2 et 4.1 2. Entre parenthèses sont indiqués
les écarts-types, alors que les intervalles de con�ance à 95% sont rapportés entre crochets. Les
résultats dont je fais mention dans le texte sont ceux des régressions avec contrôles.
Dans chacun des tableaux, la première rangée indique les coe�cients pour la régression sur
le salaire horaire. Pour chaque millimètre de pluie supplémentaire par heure, le salaire ho-
raire augmente en moyenne de 0,51%, dans l'intervalle [0,48% ; 0,54%]. La vitesse du vent
a également un impact positif, avec une augmentation de 0,07% [0,068% ; 0,074%] par kilo-
mètre/heure supplémentaire. L'e�et d'interaction donne un coe�cient négatif, mais très faible
et seulement signi�catif à 5%, situé dans l'intervalle [-0,0049% ; -0,0002%] 3 4. Pour chaque °F
supplémentaire, le salaire diminue de 0,02% [-0,0235% ; -0,0199%]. Ainsi dans l'ensemble, le
mauvais temps semble augmenter les opportunités de revenu pour les chau�eurs. L'impact le
1. Il serait certainement possible d'améliorer le modèle en ajoutant des variables explicatives pertinentessupplémentaires. Cependant, cette information ne m'est pas disponible. Il y a fort à parier qu'un chau�eurmoindrement expérimenté ait une meilleure capacité de prédiction. Toutefois, il semble plausible de croire quele niveau d'imprévisibilité reste grand.
2. Les contrôles de temps sont les mêmes indicatrices pour les fêtes, mois, jour de la semaine et période dela journée.
3. L'interaction entre la pluie et le vent permet de déterminer si le mauvais temps a un e�et sous-additif(ou super-additif) sur les variables expliquées. Une fonction est dite sous-additive si f(x1+x2) ≤ f(x1)+f(x2).Ici par exemple, avec les e�ets de la pluie et du vent positifs, l'e�et d'interaction négatif indique une sous-additivité. Ainsi, lors d'une journée pluvieuse, l'e�et marginal du vent sur le salaire horaire sera moins élevéque lors d'une journée sans pluie. Le même raisonement s'applique pour l'e�et marginal de la pluie.
4. La majorité des coe�cients sont signi�catifs à des seuils inférieurs à 0,1%. En prenant en considérationle problème de la p-value, cet e�et est sans doute négligable.
23
plus important provient du niveau de précipitations.
La seconde ligne rapporte les coe�cients de la régression sur le temps passé avec un client.
En moyenne, un millimètre de précipitation supplémentaire entraine une augmentation du
nombre de minutes par heure passée avec un client de 1,59% [1,56% ; 1,62%]. Le vent aug-
mente la durée de 0,21% [0,205% ; 0,211%] par kilomètre/heure et la température de 0,07%
[0,076% ; 0,08%] par °F. L'e�et d'interaction est toujours faible et négatif avec un coe�cient
de -0,009% [-0,0117% ; -0,0064%]. Ces résultats indiquent qu'un épisode de mauvais temps
augmente probablement la demande pour les courses de taxi.
La troisième rangée des tableaux 4.1 et 4.2 rapporte les résultats de la régression sur la distance
parcourue par heure avec un client. L'e�et d'un millimètre de pluie est d'une diminution de
0,23% [-0,273% ; -0,20%] de la distance moyenne par heure. Pour ce qui est de l'intensité du
vent, il s'en suit une diminution de 0,05% [-0,056% ; -0,049%] par km/h supplémentaire. De
même, chaque °F de plus diminue de 0,1% [-0,0998% ; -0,0951%] cette distance. L'interaction
de la pluie et du vent a�che un coe�cient positif de 0,01% [0,008% ;0,014%]. Ainsi, le mauvais
temps diminue la distance moyenne parcourue avec un client par les chau�eurs de taxi.
Les résultats présentés dans la quatrième rangée sont ceux de la régression sur le nombre
de courses e�ectuées par heure. Le millimètre de pluie additionnel augmente en moyenne le
nombre de courses de 0,13% [0,061% ; 0,20%]. Pour le vent, le kilomètre/heure additionnel en-
traine une augmentation de 0,23% [0,221% ; 0,23%]. L'e�et d'interaction est également positif
à 0,09% [0,083% ; 0,093%]. Quant à l'e�et de la température, l'augmentation d'un °F fait dimi-
nuer en moyenne le nombre de courses par heure de 0,1% [-0,1076% ; -0,0997%]. Ces résultats
indiquent qu'une mauvaise température semble augmenter les opportunités de courses.
Les coe�cients obtenus par la régression sur le nombre de taxis avec un client sur les routes
sont indiqués à la cinquième rangée des tableaux 4.1 et 4.2. La pluie fait augmenter le nombre
de taxis qui sont en fonction de 1,74% [0,075% ; 3,4%] par millimètre supplémentaire. Cet e�et
n'est toutefois signi�catif qu'à partir du seuil de 5%. Le vent a lui aussi un e�et positif de
0,33% [0,19% ; 0,47%] par km/h. L'e�et d'interaction est négatif à -0.11% [-0,25% ; -0,022%]
mais non signi�catif. Pour la température, chaque degré de plus augmente de 0,38% [0,2884% ;
0,4799%] le nombre de taxis. Ainsi, encore une fois, le mauvais temps semble avoir un impact
positif sur les opportunités de courses.
À la lumière des résultats obtenus jusqu'à présent, il semble que le modèle de comportement
dominant soit le modèle néoclassique. En e�et, la mauvaise température semble engendrer
une augmentation de la demande, comme en témoigne l'augmentation du temps passé avec un
client et la diminution dans la distance parcourue (régressions 2 et 3). Celle-ci, tel qu'indiqué
par la première régression, crée à son tour une opportunité pour les chau�eurs d'augmenter
leur revenu. Ces derniers répondraient positivement, en augmentant le nombre de courses
e�ectuées et par une présence accrue sur les routes (régressions 4 et 5).
24
En�n, la dernière rangée rapporte les coe�cients de la régression sur la durée du quart de
travail. Chaque millimètre de plus dans l'intensité des précipitations fait en moyenne augmen-
ter la durée par 0,55% [0,3807% ; 0,7229%]. L'intensité du vent a un e�et contraire, avec une
diminution de 0,12% [-0,1301% ; -0,112%] par km/h de plus. L'e�et d'interaction est lui aussi
négatif à -0,04% [-0,047% ; -0,0235%]. Pour la température, l'e�et est similaire à celui du vent,
soit une diminution de 0,15% [-0,1549% ; -0,1475%] par degré additionnel. Donc la pluie, qui
est sans doute le facteur prépondérant dans la dé�nition d'une mauvaise température, semble
entrainer une augmentation de l'o�re de travail. Ceci est conforme avec les résultats des ré-
gressions précédentes. Les chau�eurs répondent positivement aux opportunités engendrées par
un temps pluvieux.
Dans ce qui précède, j'ai fait l'hypothèse que le mauvais temps avait un impact à la hausse
sur le salaire à travers une augmentation de la demande. Comment être certain cependant que
cette hausse n'est pas plutôt due à une diminution de l'o�re par les chau�eurs ? Il est possible
en e�et d'argumenter que les intempéries puissent diminuer le plaisir de la conduite et inciter
les chau�eurs à diminuer leur activité. Il est vrai que je viens de démontrer une relation positive
entre mauvais temps et nombre de taxis sur les routes. Par contre, cette régression a�che les
coe�cients qui sont les moins signi�catifs. Dans les paragraphes qui suivent, je tente d'explorer
cette hypothèse plus en détail. Je con�rme d'abord l'e�et sur la demande, pour ensuite me
tourner vers l'o�re.
E�et sur la demande
Pour con�rmer l'impact des conditions météorologiques sur la demande du service de taxi new-
yorkais, j'utilise mes données sous la forme d'une observation par course et procède avec une
régression de la distance parcourue par course sur mes variables météorologiques. Je contrôle
également pour le temps.
L'idée justi�ant cette régression s'illustre de la manière suivante. On imagine un individu qui
doit se déplacer sur une distance relativement courte, peut-être quelques pâtés de maisons.
A�n de se rendre à sa destination, cet individu a un choix à faire entre les di�érents modes
de transport qui s'o�rent à lui. Lors d'une journée ensoleillée, il choisira vraisemblablement
l'option la moins coûteuse, soit la marche. Lors d'une journée pluvieuse cependant, cette
option lui semblera moins attrayante. Il est ainsi plus probable qu'il opte pour un autre mode
de déplacement, par exemple les services d'un taxi. Du point de vue du chau�eur, toutes choses
étant égales par ailleurs, cela équivaut à e�ectuer une course supplémentaire pour laquelle la
distance est vraisemblablement inférieure à la moyenne. Ainsi, lors d'une journée pluvieuse,
la distance moyenne e�ectuée lors d'une course devrait diminuer. Si le mauvais temps a l'e�et
que je lui suppose, je devrais donc observer une relation négative dans cette régression.
Sans trop de surprises, tous les coe�cients d'intérêt sont négatifs. Pour chaque millimètre
25
Table4.1�
Réactions
dumarchédestaxisau
mauvaistemps.Régressions
parMCO
(sanscontrôles)
Régression
Sanscontrôles
Pluieen
mm
Vent(k/h)
Tem
p.(°F)
Interaction
(1)LnSalairehoraire
0.0073
***
0.0021
***
0.0005
***
-0.0002***
(0.0001)
(0.00001)
(0.000004)
(0.00001)
[.007043;.007625]
[.002073;.002124]
[.000484;.000501]
[-.000242;-.000195]
(2)LnTem
pspasséavec
unclient
parheure(m
in.)
0.0233
***
0.0058
***
0.0018
***
-0.0007***
(0.00017)
(0.00001)
(0.000005)
(0.00001)
[.022973;.023622]
[.005732;.005787]
[.001829;.001847]
[-.000744;-.000692]
(3)LnDistanceavec
unclient
parheure(km)
-0.0049***
-0.0008***
-0.0003***
0.0003
***
(0.0002)
(0.00002)
(0.000006)
(0.00002)
[-.005278;-.004502]
[-.000803;-.000737]
[-.000279;-.000257]
[-.002728;-.001959]
(4)LnNom
brede
courses
e�ectuéesparheure
0.0043
***
0.0057
***
-0.0017***
0.0002
***
(0.0003)
(0.00003)
(0.000009)
(0.00003)
[.003601;.004963]
[.005657;.005769]
[-.001678
;-.001642]
[.000106;.000219]
(5)LnNom
brede
taxisavec
unclient
surlesroutes
parheure
0.0426
***
0.0134
***
0.0038
***
-0.0036***
(0.0122)
(0.001)
(0.0003)
(0.001)
[.023708;.061567]
[.011558;.015234]
[.003219;.004436]
[-.005404;-.001837]
(6)LnDurée
duquartde
travail
0.0079
***
-0.0001**
-0.00004
***
0.00009
(0.0008)
(0.00004)
(0.00001)
(0.00005)
[.005939;.009902]
[-.000248;-.000043]
[-.000065;-.000021]
[-.000045;.000229]
***signi�catifà0,1%
;**
1%;*5%
;'10%.
26
Table4.2�
Réactions
dumarchédestaxisau
mauvaistemps.Régressions
parMCO
(aveccontrôles)
Régression
Avec
contrôles
Pluie(m
m)
Vent(k/h)
Tem
p.(°F)
Interaction
(1)LnSalairehoraire
0.0051
***
0.0007
***
-0.0002***
-0.00003
*(0.00015)
(0.00001)
(0.000009)
(0.00001)
[.004826;.005407]
[.000684;.000736]
[-.000235;-.000199]
[-.000049;-.000002]
(2)LnTem
pspasséavec
unclient
parheure(m
in.)
0.0159
***
0.0021
***
0.0007
***
-0.00009
***
(0.0002)
(0.00001)
(0.00001)
(0.00001)
[.015569;.016227]
[.002054;.00211]
[.000761;.0008]
[-.000117;-.000064]
(3)LnDistanceavec
unclient
parheure(km)
-0.0023***
-0.0005***
-0.001
***
0.0001
***
(0.0002)
(0.00002)
(0.00001)
0.00002
[-.002728;-.001959]
[-.0005561
;-.000488]
[-.000998;-.000951]
[.00008
;.000143]
(4)LnNom
brede
courses
e�ectuéesparheure
0.0013
***
0.0023
***
-0.001
***
0.0009
***
(0.0003)
(0.00003)
(0.00002)
(0.00003)
[.000605;.001959]
[.002207;.002322]
[-.001076;-.000997]
[.000825;.000937]
(5)LnNom
brede
taxisavec
unclient
surlesroutes
parheure
0.0174
*0.0033
***
0.0038
***
-0.0011
(0.0087)
(0.0007)
(0.0005)
(0.0007)
[.000754;.034001]
[.001853;.004655]
[.002884;.004799]
[-.002453;-.000224]
(6)LnDurée
duquartde
travail
0.0055
***
-0.0012***
-0.0015***
-0.0004***
(0.0006)
(0.00004)
(0.00002)
(0.00005)
[.003807;.007229]
[-.001301;-.00112]
[-.001549;-.001475]
[-.00047
;-.000235]
***signi�catifà0,1%
;**
1%;*5%
;'10%
.
27
de précipitation additionnel, la distance moyenne d'une course diminue de 0,43% [-0,4604% ;
-0,4002%]. L'intensité du vent entraine une diminution de 0,167% [-0,1697% ; -0,1647%] par
km/h. L'e�et d'interaction a�che un coe�cient de -0,02% [-0,0232% ; -0,0185%]. Seul e�et
curieux, la distance moyenne diminue avec l'augmentation en température, à raison de -0,05%
[-0,0536% ; -0,0501%] par degré Fahrenheit. Tous ces résultats sont signi�catifs au seuil de
0,1%. Ainsi, il semble acceptable d'attribuer aux mauvaises conditions météorologiques un
impact positif sur la demande.
E�et sur l'o�re
Comme je l'ai mentionné précédemment, il pourrait être justi�é de croire à un e�et ambigu
du mauvais temps sur l'o�re de services de taxi. D'abord, si les chau�eurs suivent le modèle
intertemporel, on imagine facilement un e�et positif causé par une perspective de revenus plus
importants, suivant l'augmentation de la demande. D'autre part, il pourrait aussi y avoir un
e�et négatif, causé par un désagrément associé au fait de conduire sous de mauvaises conditions
météorologiques, qui n'a rien à voir avec le désir d'atteindre un objectif. Dans tous les cas,
l'e�et dominant donnera son sens à la variation de l'o�re. Comme en font foi les résultats
précédents, cet e�et semble être en moyenne davantage en faveur de l'augmentation de l'o�re.
Est-il possible cependant que l'e�et dominant soit di�érent pour certains chau�eurs ?
Si ces deux types de chau�eurs existent, je devrais observer pour certains d'entre eux une aug-
mentation du nombre de courses e�ectuées par heure. Pour les autres, je m'attends à trouver
une diminution, dans la mesure où le désagrément encouru par la conduite lors de mauvaises
conditions aurait un e�et dominant. A�n d'arriver à faire la distinction des chau�eurs selon ces
deux types, je suppose d'abord que la distribution de mes données puisse s'exprimer comme un
mélange de deux composantes gaussiennes. Je procède ensuite à l'estimation des paramètres
du mélange en utilisant un algorithme nommé Espérance-Maximisation (E-M). Le tout est
décrit dans ce qui suit 5.
Modèle de mélange gaussien Je soupçonne donc la présence de deux types de compor-
tement chez les chau�eurs. En posant l'hypothèse que ces deux groupes sont distribués nor-
malement, je peux exprimer la fonction de densité de mes données comme une combinaison
convexe, telle que
p(x|θ) = πN (xi|µ1,Σ1) + (1− π)N (xi|µ2,Σ2)
5. Cette présentation est en grande partie basée sur le document � Note Set 4 : Finite Mixture Models
and the EM Algorithm � par M. Padhraic Smyth, professeur au département d'informatique de l'université deCalifornie à Irvine
28
Où p(x|θ) désigne la vraisemblance d'observer xi ;
xi représente les observations d'un chau�eur pour une heure donnée dans l'année ;
θ = (π, µ1, µ2,Σ1,Σ2) représente l'ensemble des paramètres ;
π est l'importance du premier groupe dans la distribution ;
µk est le vecteur de moyennes pour le groupe k ;
Σk est la matrice de variance-covariance pour le groupe k.
La fonction de log-vraisemblance est donnée par
logL(Θ|X) =
N∑i=1
log[πN (xi|µ1,Σ1) + (1− π)N (xi|µ2,Σ2)
].
Normalement, il serait possible d'estimer aisément les paramètres qui maximisent une fonction
de log-vraisemblance de façon analytique en cherchant l'estimateur du maximum de vraisem-
blance (MLE)
Θ∗ = argmaxΘ
log L(Θ|X).
Cependant, l'appartenance de chaque observations quant aux di�érentes composantes de la
mixture est inconnue, ce qui rend ardue l'utilisation de l'estimateur MLE. A�n de contourner
cette di�cultée, je fait appel à l'algorithme itératif E-M, qui est souvent présenté comme la
solution aux problèmes de données manquantes.
Algorithme E-M La première étape de l'algorithme (étape E pour espérance) consiste à
calculer la probabilité a posteriori que l'observation i appartienne à chacun des types. Celle-ci
s'obtient par la règle de Bayes :
zi1 = p(k = 1|xi) =p(k = 1)p(xi|k = 1)
p(xi)=
πN (xi|µ1,Σ1)
πN (xi|µ1,Σ1) + (1− π)N (xi|µ2,Σ2).
Puisque je suppose l'existence de deux groupes seulement, zi2 = 1− zi1. Comme à la première
itération les di�érents paramètres sont inconnus, il est nécessaire d'initialiser l'algorithme avec
des valeurs arbitraires.
La seconde étape (étape M pour maximisation), consiste à réévaluer les paramètres que l'on
cherche à estimer, en pondérant chaque observation par sa probabilité d'appartenir au groupe
en question. Comme je me trouve à estimer les paramètres de densités gaussiennes, ceux-ci
sont donnés par
29
µk =
∑Ni=1 zikxi∑Ni=1 zik
Σk =
∑Ni=1 zik(xi − µk)(xi − µk)T∑N
i=1 zik
πk =1
N
N∑i=1
zik
L'algorithme alterne ensuite entre les étapes E et M jusqu'à la convergence de la log-vraisemblance.
Une fois cette convergence établie, l'information contenue dans l'estimation des matrices de
covariance nous permet d'obtenir les réactions recherchées pour chacun des groupes identi�és.
Les résultats sont rapportés dans le tableau 4.3 6.
Table 4.3 � Résultats d'un FMM à deux composantes d'une régression du nombre decourses/heure sur le mauvais temps.
Régresseurs Groupe 1 Groupe 2
Pluie 0,00265 *** 0,00033(0,00072) (0,00114)[0,001235 ; 0,004064 ] [-0,00191 ; 0,002577]
Vent 0,00111 *** 0,00237 ***(0,000065) (0,000097)[0,000983 ; 0,001238] [0,002183 ; 0,002563]
Interaction 0,00011 ' 0,00131 ***(0,00006) (0,00009)[-0,000011 ; 0,000224] [0,001128 ; 0,001489]
Température 0,00036 *** -0,00194 ***(0,00004) (0,00007)[0,000275 ; 0,000453] [-0,002068 ; -0,001805]
*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.
Contrairement à mes attentes, ceux-ci sont plutôt similaires dans les deux cas. En moyenne,
l'e�et du millimètre de pluie additionnel est une augmentation du nombre de courses e�ec-
tuées par heure de 0,26% [0,124% ; 0,41%] pour le premier type de chau�eur et de 0,03%
[-0,19% ; 0,26%] pour le second. Cependant, le coe�cient estimé pour le second groupe n'est
pas signi�catif. Le vent augmente quant à lui le nombre de courses par heure moyen de 0,11%
[0,098% ; 0,124%] et 0,237% [0,218% ; 0,256%], pour le premier et deuxième groupe respecti-
vement. Les e�ets d'interaction sont positifs à 0,01% [-0,0011% ; 0,023%] et 0,13% [0,113% ;
6. Le terme FMM fait référence à �nite mixture models, qu'il serait possible de traduire librement par� modèle de combinaison �ni de densités �.
30
0,149%], mais seulement celui du second groupe semble signi�catif. En�n, la di�érence la plus
notable provient de l'e�et de la température. Pour les chau�eurs du premier groupe, un °F
supplémentaire entraine une augmentation de 0,036% [0,028% ; 0,045%], alors qu'il entraine
pour le second groupe une diminution de 0,19% [-0,207% ; -0,181%]. Contrairement à ce que
j'ai prédit, aucun des deux groupes de chau�eurs ne semble diminuer le nombre de courses
e�ectuées lors d'intempéries. Pour le moment, il ne semble donc pas y avoir de groupe pour
lequel l'e�et de désagrément soit dominant.
A�n de m'en convaincre davantage, je procède par la même méthode pour analyser l'impact
du mauvais temps sur la durée moyenne du quart de travail. Si les deux types de chau�eurs
coexistent dans mes données, une partie d'entre eux sera incitée à travailler plus longtemps.
Les autres, au contraire, désireront arrêter plus tôt. Le mauvais temps aura ainsi un impact
opposé chez les deux groupes. Je rapporte les résultats de cette régression dans le tableau 4.4.
Table 4.4 � Résultats d'un FMM à deux composantes d'une régression du nombre d'heurestravaillées sur le mauvais temps
Régresseurs Groupe 1 Groupe 2
Pluie 0,0094 ** 0,000416(0,00352) (0,00043)[0,002481 ; 0,01627 ] [-0,000429 ; 0,00126]
Vent -0,0099 *** -0,0001 ***(0,00023) (0,00003)[-0,010402 ; -0,009498] [-0,000156 ; -0,000052]
Interaction -0,0012 *** 0,00001(0,00027) (0,00003)[-0,001757 ; -0,000703] [-0,000053 ; 0,000068]
Température -0,009 *** -0,00032 ***(0,00012) (0,00001)[-0,00928 ; -0,008801] [-0,000347 ; -0,0003]
*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.
Ici aussi, les résultats rapportés sont plutôt similaires pour les deux groupes identi�és. L'e�et
relatif aux précipitations est positif dans les deux cas avec une augmentation de 0,94% [0,25% ;
1,63%] pour le premier groupe et une autre de 0,04% [-0,0429% ; 0,126%] pour le second.
Toutefois, le coe�cient du second groupe identi�é n'est pas signi�catif. L'augmentation dans
l'intensité du vent entraine une diminution des heures travaillées de 0,99% [-1,04% ; -0,949%]
pour les chau�eurs du premier groupe et une diminution de 0,01% [-0,016% ; -0,0052%] pour
ceux du second. La seule divergence se trouve au niveau de l'e�et d'interaction, avec un
coe�cient de -0,12% [-0,176% ; -0,07%] pour le premier groupe et un autre de 0,001% [-0,005% ;
0,007%] pour le second, qui n'est cependant pas signi�catif. En�n, les deux groupes réagissent
en moyenne par une diminution des heures travaillées suite au °F de température additionnel,
31
en raison de -0,9% [-0,93% ; -0,88%] pour les chau�eurs du premier groupe et de -0,032% [-
0,035% ; -0,03%]. Dans l'ensemble, les résultats sont également très semblables à ceux trouvés
par la même régression faite sur l'ensemble des chau�eurs (tableau 4.2, rangée 6). Encore une
fois, comme la pluie est sans doute le facteur prépondérant en terme de mauvais temps et
qu'elle entraine une augmentation signi�cative des heures travaillées pour le premier groupe,
ces chau�eurs semblent avoir un comportement en accord avec le modèle intertemporel.
Pour ce qui est du second groupe, la conclusion est moins claire. Parce que la réaction face
au vent est négative, on peut être porté à y voir un désagrément causé par le mauvais temps.
Ceci dit, cet e�et est plutôt faible. De plus, le fait que le coe�cient relatif aux précipitations
ne soit pas signi�catif enlève beaucoup de force à cette conclusion. Je note également au
passage qu'il ne semble pas plus y avoir d'arguments solides en faveur d'un comportement
reference-dependent.
Ainsi, aucun groupe de chau�eur ne semble signi�cativement sou�rir d'un e�et de désagrément
dominant. Ce pourrait-il alors que les mauvaises conditions météorologiques a�ectent leur
comportement d'une autre manière ? Pour explorer cette avenue, j'observe l'e�et qu'ont ces
variables sur la distance par heure parcourue avec un client à bord. Les résultats se retrouvent
dans le tableau 4.5.
Table 4.5 � Résultats d'un FMM à deux composantes d'une régression de la distance/heuresur le mauvais temps
Régresseurs Groupe 1 Groupe 2
Pluie 0,00673 *** -0,0054 ***(0,0007) (0,00019)[0,005347 ; 0,008117] [-0,005785 ; -0,00508]
Vent 0,00062 *** -0,001 ***(0,00006) (0,000016)[0,000504 ; 0,000737] [-0,001059 ; -0,000995]
Interaction -0,00029 *** 0,0002 ***(0,00006) (0,000015)[-0,000412 ; -0,00018] [0,00017 ; 0,00023]
Température -0,00046 *** -0,00118 ***(0,00004) (0,000011)[-0,000543 ; -0,000382] [-0,0012 ; -0,001155]
*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.
Cette fois-ci, j'arrive à distinguer clairement deux types de comportements. Pour le premier
groupe identi�é par l'algorithme, la réponse est positive. C'est-à-dire que les chau�eurs de ce
groupe augmentent en moyenne la distance parcourue en une heure par 0,67% [0,53% ; 0,81%]
pour chaque millimètre de précipitation supplémentaire. La distance moyenne est accrue de
32
0,062% [0,05% ; 0,074%] suite à l'augmentation d'un km/h d'intensité du vent. L'e�et d'in-
teraction est négatif à -0,03% [-0,04% ; -0,02%]. En�n, chaque °F additionnel entraine une
diminution de 0,05% [-0,054% ; -0,038%] dans la distance parcourue.
Les réponses du second groupe de chau�eur sont contraires à celles du premier. Ceux-ci ré-
agissent en moyenne par une diminution de 0,54% [-0,58% ; -0,5%] dans la distance par heure
pour chaque millimètre de pluie. Même réaction face au vent, avec une diminution de 0,1%
[-0,106% ; -0,0995%] par km/h. Pour ces chau�eurs cependant, l'e�et d'interaction est positif à
0,02% [0,017% ; 0,023%]. L'augmentation de température d'un °F est suivie d'une diminution
de 0,118% [-0,12% ; -0,116] de la distance parcourue par heure.
On peut trouver deux sources d'explications à cette di�érence. D'un côté, comme les chau�eurs
du second groupe a�chent une diminution dans la distance moyenne parcourue , mais pas dans
le nombre de courses e�ectuées, il se peut que ceux-ci soient simplement plus prudents dans
leur conduite. Alternativement, il est possible que le mauvais temps mette en évidence une
spécialisation chez les chau�eurs. Par exemple, certains d'entre eux pourraient chercher à se
limiter à des courses plus courtes, mais plus nombreuses, situées dans le centre-ville. Quant
au reste, les courses plus longues mais également plus payantes de la banlieue et des aéroports
a�cheront un intérêt supérieur.
Dans l'ensemble, ce qui ressort de cette analyse de l'hétérogénéité du comportement est que
les chau�eurs ne se laissent pas décourager par le mauvais temps. Aucun argument solide en
faveur du modèle reference-dependent n'a été identi�é. Le modèle intertemporel sort vainqueur
de cette manche.
4.3 Estimation d'élasticités
Je passe maintenant à l'étape suivante de mon mémoire, soit l'estimation d'élasticités salaire
de l'o�re de travail. En temps normal, pour obtenir une élasticité, il me su�rait d'utiliser mes
données sous leur forme où une observation représente un quart de travail et de régresser le
log du nombre d'heures travaillées sur le log du salaire horaire. Par contre, en procédant ainsi,
je m'expose à un problème d'endogénéité.
Formellement, le modèle que je tente d'estimer est le suivant
y = β0 + β1x1 + . . .+ βkxk + e
33
Où x1 =riyi
est le salaire horaire ;
y est le nombre d'heures travaillées ;
r est le revenu total du quart de travail ;
xk(k ∈ {2, . . . ,K}) sont mes variables de contrôle pour le temps, soit des régresseurs exogènes ;
e est le terme d'erreur.
On dit d'un régresseur qu'il est endogène si celui-ci est corrélé avec le terme d'erreur, de telle
sorte que
E[ei|xi] = ηi 6= 0.
L'endogénéité est causée par la façon dont je dé�nis le salaire horaire. Comme celui-ci est
fonction du nombre d'heures travaillées et que ce nombre dépend lui-même du terme d'erreur,
la corrélation est évidente. Par cette dernière, l'une des hypothèses sur lesquelles se base
le modèle de régression linéaire se trouve être violée. Cela a pour conséquence directe que
l'estimation du vecteur de paramètre β par la méthode des MCO donnera un résultat biaisé
E[βMCO|X] = β + (X′X)−1X′η 6= β,
X étant la matrice de régresseurs. Qui plus est, il existe une autre source potentielle de
corrélation entre le terme d'erreur et le salaire horaire, soit l'omission de variable. Le nombre
d'heures travaillées est un choix fait par le chau�eur. Comme toutes décisions humaines, celle-
ci sera vraisemblablement in�uencée par une myriade de facteurs, dont le modèle ne peut
prétendre faire la liste exhaustive. On peut penser par exemple au fait d'avoir une jeune
famille, au niveau de motivation du chau�eur, son âge ou encore sa santé physique. Ces
variables, évidemment corrélées avec la durée du quart de travail, le sont également avec le
salaire horaire, par dé�nition. Par contre, comme elles ne sont pas disponibles, je dois les
omettre et considérer qu'elles font partie du terme d'erreur. Encore une fois, l'estimation d'un
tel modèle donnera un estimateur β inconsistant.
A�n de remédier à ces problèmes, je dois faire appel aux méthodes d'estimation par variables
instrumentales.
Méthode d'estimation par variables instrumentales 7
Une variable instrumentale (ou instrument), souvent dénotée par la lettre z, possède la pro-
priété de n'a�ecter directement que le régresseur soufrant d'endogénéité. Ainsi, un instrument
valide doit se trouver à l'extérieur du modèle initial et respecter les conditions
7. Cette section s'inspire fortement de l'ouvrage de Cameron et Trivedi(2005). Elle se base également surGreen(2011) et le �chier d'aide du package ivreg2 de Stata.
34
Corr(x1, z) 6= 0 et Corr(z, e) = 0.
Avec un ensemble de variables qui respecte ces deux propriétés, il me serait possible de purger
les variations du salaire horaire de leur partie liée au terme d'erreur. Pour se faire, il su�t dans
une première étape de régresser le salaire horaire sur l'ensemble des instruments. Comme ces
derniers ne sont pas corrélés avec le terme d'erreur, il s'en suit que les valeurs ainsi prédites
du salaire horaire seront (asymptotiquement) exogènes. Par la suite, en utilisant ces valeurs
prédites pour remplacer le salaire horaire endogène dans le modèle initial, j'obtiendrai par
régression MCO l'e�et recherché d'une variation du salaire horaire sur le nombre d'heures
travaillées. Si l'ensemble d'instruments n'en contient qu'un seul, on parlera alors de l'estimateur
par Variable Instrumentale (VI). Si l'ensemble contient plusieurs instruments, on parle alors
de l'estimateur par Moindres Carrés à Deux Étapes (MC2E). C'est ce dernier que j'utilise
pour mon analyse et il peut se résumer par l'équation suivante
βMC2E =
[X′Z(Z′Z)−1Z′X
][X′Z(Z′Z)−1Z′y
].
Il peut être démontré que l'estimateur par MC2E est asymptotiquement distribué selon une
loi normale de variance
V (βMC2E) = s2[X′Z(Z′Z)−1Z′X]−1,
où la variance du terme d'erreur est calculée avec les régresseurs du modèle initial
s2 =1
n
n∑i=1
(yi − x′iβMC2E)2.
Les instruments que je retiens sont les moyennes des précipitations de pluie ainsi que la vitesse
du vent durant le quart de travail. Avant de s'intéresser aux résultats d'une telle estimation,
il serait de bon ton de chercher à véri�er les deux conditions relatives aux instruments.
La condition de corrélation entre le salaire horaire et mes deux instruments peut se véri�er à
l'aide de la première étape de l'estimation par MC2E. Le tableau 4.6 rapporte les résultats de
celle-ci, pour trois spéci�cations di�érentes. La première est la plus simple possible. La seconde
contient en plus des contrôles pour le temps. La troisième considère en plus la présence d'e�ets
�xes chez les chau�eurs. Comme j'obtiens que l'e�et de la pluie et du vent sont signi�catifs
et ce peu importe la spéci�cation (même en étant attentif au problème de la p-value), il s'en
suit que cette condition est respectée.
35
Table 4.6 � Résultats de la première étape des régressions par MC2E
Spéci�cation(1) (2) (3)
Pluie0,0113356 *** 0,0103021 *** 0,0092649 ***(0,0001692) (0,0001732) (0,0001504)
[0,0110039 ; 0,0116672] [0,0099627 ; 0,0106415] [0,0089701 ; 0,0095597]
Vent0,0012551 *** 0,0005292 *** 0,0006177 ***(0,0000231) (0,0000263) (0,0000233)
[0,0012099 ; 0,0013003] [0,0004777 ; 0,0005807] [0,0005721 ; 0,0006633]
Contrôles Non Oui OuiE�ets �xes Non Non Oui*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.
Pour ce qui est de la seconde condition, qui stipule que l'instrument doit être exogène, la
véri�cation est légèrement plus complexe. Si le modèle à estimer est � exactement identi�é �,
c'est-à-dire que le nombre d'instruments est égal au nombre de variables à instrumenter, la
véri�cation n'est pas possible. Heureusement, dans le cas d'un modèle suridenti�é comme le
mien, il est possible de faire appel au test de Sargan-Hansen. L'intuition derrière ce test est la
suivante. Dans un premier temps, on utilise l'ensemble des instruments retenus pour estimer
le modèle par MC2E. Avec le résultat de cette estimation, on obtient les résidus
e = y −X′βMC2E.
On projette ensuite ces résidus sur l'ensemble des instruments utilisés dans l'estimation pré-
cédente, tel que
e = Zδ + υ,
où υ est un autre terme d'erreur. À cette régression est associé un R2, avec lequel on crée la
statistique de test égale à N × R2, qui suit une loi de Khi-deux dont le degré de liberté est
donné par la di�érence entre le nombre d'instruments et le nombre de variables instrumentées.
L'hypothèse nulle de ce test est que l'ensemble des instruments utilisés n'est pas corrélé avec
le terme d'erreur. Ainsi, le rejet de cette hypothèse fait apparaître un doute sur la validité des
instruments.
À la manière dont est calculée cette statistique, il est évident que l'utilisation d'un grand
échantillon donnera une valeur élevée, ce qui augmente la probabilité de rejet. En soi, il est
cependant clair que la taille des données n'a aucun lien avec la validité réelle d'un instrument.
36
A�n d'essayer de contourner (et illustrer) ce problème, je procède par une simple méthode
de rééchantillonnage. Je tire 1000 sous échantillons de 0,5%, 1%, 5%, 20% et 30% de mes
données. Pour chacun des sous-échantillons, j'estime ensuite le modèle par MC2E a�n de
pouvoir observer la statistique du test de Sargan-Hansen et la probabilité de rejet qui lui est
associée.
Pour les 1 000 sous échantillons de taille 0,5%, le test rejette la validité de l'ensemble des
instruments 7,4% du temps au seuil de 5%. En moyenne, la p-value du test est de 49,66%
et l'élasticité salaire estimée est de 71,07%. Pour des sous-échantillons de taille 1%, le rejet
s'e�ectue 8,8% du temps. La p-value moyenne est de 45,63% et l'élasticité de 73,34%. Lorsque
la taille des sous-échantillons est augmentée à 5%, le test rejette la validité 43% du temps,
toujours pour le même seuil. Pour cette taille de sous-échantillon, la moyenne de la p-value est
à 17,24% et l'élasticité estimée moyenne reste assez stable à 71,04%. Avec des tailles de 20%
et 30%, j'observe un rejet 98,1% et 99,9% du temps respectivement. En moyenne, la validité
est rejetée dans les deux cas, à des p-value de 0,5% et 0,027%. Quant aux élasticités salaires
moyennes, celles-ci restent toujours stables à 70,69% et 70,86% respectivement.
Comme avec de faibles pourcentages de taille d'échantillon je conserve toujours un nombre
acceptable de données pour faire de l'inférence statistique, et qu'à ces pourcentages le test
de Sargan-Hansen ne semble pas rejeter l'hypothèse nulle de validité, j'en conclus que les
moyennes de pluie et de vent sont des instruments valides 8.
Résultats
Je présente maintenant dans le tableau 4.7 les élasticités estimées par la méthode MC2E faite
sur l'échantillon totale.
Table 4.7 � Élasticitées estimées par MC2E
Spéci�cation(1) (2) (3)
Élasticitée salaire0,4347554 *** 0,5724568 *** 0,4841766 ***(0,0235398) (0,031018) (0,027734)
[0,3886183 ; 0,4808926] [0,5116626 ; 0,6332509] [0,429819 ; 0,5385342]
Contrôles Non Oui OuiE�ets �xes Non Non Oui
*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.
Je constate qu'avec la spéci�cation la plus simple possible, l'élasticité estimée est substantiel-
lement positive et fortement signi�cative. Sous cette spéci�cation, une augmentation tempo-
raire du salaire horaire de 1% entrainerait une augmentation de 0,43% [0,39% ; 0,48%] dans
le nombre d'heures travaillées. En ajoutant des contrôles pour le temps au modèle estimé,
8. 0,5% de mon échantillon total donne plus de 35 000 observations.
37
l'élasticité devient plus forte et a�che une augmentation de l'ordre de 0,57% [0,51% ; 0,63%].
Si je prends en plus en compte de la présence d'e�ets �xes chez les chau�eurs, l'augmentation
du nombre d'heures travaillées retombe à 0,48% [0,43% ; 0,54%].
Dans l'ensemble les résultats sont en accord avec le modèle intertemporel et ne sont pas très
éloignés des estimations de Farber (2015). Ceci est particulièrement le cas pour la spéci�cation
avec contrôles et sans e�ets �xes. Ainsi, il s'agit encore une fois d'un argument en faveur de
ce modèle.
Il semble également clair que le choix des instruments peut avoir un impact important sur
le résultat de telles estimations. En e�et, Camerer, Babcock, Loewstein et Thaler (1997),
en utilisent comme instrument les 25e, 50e et 75e percentiles de la distribution du salaire
des autres chau�eurs, obtiennent des élasticités qui sont clairement négatives. Même chose
pour Chou (2002), qui se sert du salaire moyen des autres chau�eurs. J'attribue cependant
les élasticités négatives estimées dans ces articles à un mauvais choix d'instrument. D'abord
parce que, dans le premier cas, peu d'e�orts ont été placés dans la véri�cation des conditions de
validité des instruments 9. Ensuite, il me semble intuitivement fort probable que la distribution
des salaires puisse être a�ectée par un facteur inobservé, par exemple une convention ou un
évènement quelconque. À l'inverse, les conditions météorologiques y sont vraisemblablement
moins sensibles.
4.4 Modèle de choix discret 10
Comme le démontre Farber(2005), la méthode économétrique utilisée pour identi�er le modèle
pertinent peut avoir un impact important sur les conclusions �nales. Ainsi, bien que les résul-
tats des estimations précédentes accordent généralement la victoire au modèle intertemporel,
je désire complété mon analyse par l'estimation d'un modèle en choix discret. Suivant Farber
(2005, 2008 et 2015) ainsi que Crawford et Meng (2011), il est possible de voir la complétion
de chaque course e�ectuée par un chau�eur comme étant un point de décision pour celui-ci.
À ce moment, le chau�eur peut choisir entre arrêter pour la journée ou faire encore une autre
course. Ainsi cette décision, dénotée ici yi, est telle que
yi =
{1 si le chau�eur arrête.
0 si le chau�eur continu.
La probabilité p que le chau�eur prenne la décision d'arrêter de travailler est dé�nie comme
9. Comme les travaux de Sargan et de Hansen qui ont mené au test utilisé plus tôt ont paru plus de 10 ansavant l'article de Camerer et coll. (1997), et vu la relativement petite taille des échantillons utilisés, il auraitété tout à fait possible de le faire.10. Encore une fois grandement inspiré de Cameron et Trivedi (2005).
38
pi ≡ Pr[yi = 1|x] = F (x′iβ).
où F (x′β) est une fonction qui dépend d'un vecteur de régresseurs X incluant le nombre
d'heures travaillées depuis le début du quart de travail, le montant accumulé lors de celui-ci,
le cumulatif des distances parcourues avec un client à bord ainsi que le nombre de courses
e�ectuées. À ces variables, j'en ajoute une autre rapportant le salaire horaire touché par le
chau�eur pour les cinq dernières courses qui ont été e�ectuées dans l'heure qui précédent la
prise de décision. Cette variable a pour but de capter l'e�et du � momentum �observé par le
chau�eur. En�n, les contrôles habituels sont également inclus.
Ici encore, les deux modèles de comportement ont des prédictions très di�érentes quant aux
résultats de cette estimation. Pour un chau�eur ayant un comportement � intertemporel �,
la décision d'arrêter de travailler devrait surtout être in�uencée positivement par le nombre
d'heures qu'il a travaillé depuis le début de son quart de travail. De plus, l'importance du
montant accumulé ne devrait pas l'inciter à retourner chez lui. Au contraire même, elle devrait
l'encourager à continuer. Ainsi, si la majorité des chau�eurs sont � intertemporel �, je devrais
obtenir des e�ets marginaux estimés pour le nombre d'heures travaillées et le montant accumulé
qui sont respectivement négatifs et positifs.
Dans le cas contraire, pour un chau�eur ayant pour objectif d'atteindre un certain revenu, la
décision sera in�uencée de manière positive par le montant accumulé, et moins fortement par
le nombre d'heures qui ont été travaillées. Donc, pour un tel type de comportement, l'e�et
marginal estimé relatif au montant cumulatif devra être clairement positif.
Le choix de la fonction F (x′β) déterminera le type de modele de choix discret à utiliser.
Additive random utility models/ modèle Probit
Le type de modèle où un individu doit faire un choix entre deux alternative selon celle qui
lui apporte un plus grand niveau de satisfaction est quali�é de Modèle d'Utilité Aléatoire
(Random Utility Model). Une version additive de ce type de modèle spéci�era des fonction
d'utilités pour les deux alternatives qui ont la forme suivante
U0 = V0 + ε0,
U1 = V1 + ε1,
où V0 et V1 sont les parties déterministes de l'utilité et où ε0 et ε1 sont les parties aléatoires.
Comme l'alternative qui donne un plus grand niveau de satisfaction est choisie, y = 1 sera
observée si U1 > U0. Comme on considère la présence d'une partie aléatoire dans l'utilité, le
choix de l'individu est un évènement aléatoire avec probabilité
39
Pr[y = 1] = Pr[U1 > U0]
= Pr[V1 + ε1 > V0 + ε0]
= Pr[ε0 − ε1 < V1 − V0]
= F (V1 − V0).
La fonction F s'interprète comme étant la fonction de densité cumulée de (ε0 − ε1). Si on
suppose que ε0 et ε1 suivent toutes deux une loi normale et que l'on normalise leur di�érence,
il en découle directement que la fonction F est la densité cumulée de la loi normale standardisée
Φ(x′β) =
∫ x′β
−∞
1√2πe−z
2/2dz.
Cette fonction est celle utilisée par l'estimation d'un modèle probit.
L'estimation des paramètres se fait par maximum de vraisemblance sur une distribution de Ber-
noulli (comme la variable y n'a que deux instances possibles). La fonction de log-vraisemblance
prend donc la forme suivante :
logL =N∑i=1
[yi logΦ(x′β) + (1− yi) log (1− Φ(x′β))
].
Une fois les paramètres obtenus, il su�t de dériver la fonction de densité cumulée par l'une de
ses variables pour connaître l'impact de sa variation sur la probabilité qu'un chau�eur décide
d'arrêter de travailler
∂Φ(x′β)
∂x= φ(x′β)β.
Les résultats
En raison de contraintes calculatoires, j'ai dû séparer l'estimation de mon modèle probit sur
la base de chaque mois de l'année. Les principaux résultats d'intérêt, soit les e�ets marginaux
moyens relatifs à l'augmentation du montant cumulatif et du temps écoulé depuis le début du
quart de travail, sont rapportés dans le tableau .20. Ceux-ci semblent, encore une fois, être en
faveur du modèle intertemporel.
La première constatation que je fais à partir de ces résultats est que l'importance du montant
cumulé lors du quart de travail semble inciter les chau�eurs à repousser dans le temps leur
décision d'arrêter de travailler. En e�et, pour chacun des mois, l'e�et marginal moyen de
cette variable est négatif. En décembre, celui-ci est à son plus fort, avec une diminution de la
40
probabilité d'arrêt de -0,1615% [-0,1665% ; -0,1564%] pour chaque 10$ supplémentaire. C'est
au mois de mai que l'e�et est à son plus faible, en a�chant une diminution de -0,0241% [-
0,0283% ; 0,02%] pour chaque 10$ de plus. Bien que cet e�et puisse sembler faible, il n'est
jamais positif, comme le prédit un comportement d'atteinte d'objectif.
En ce qui a trait à l'e�et du temps écoulé depuis le début du quart de travail, celui-ci semble
plutôt constant à travers les mois. Il est, sans grande surprise, toujours positif. L'e�et est à
son plus fort au mois d'août, avec une augmentation de la probabilité d'arrêt d'en moyenne
1,363% [1,35% ; 1,37%] pour une heure de travail supplémentaire. Il est à son plus faible en
février, avec une augmentation de 1,23% [1,227% ; 1,2398%] par heure additionnelle.
Curieusement, le salaire horaire des cinq dernières courses dans l'heure précédent la décision du
chau�eur ne semble pas avoir d'in�uence signi�cative sur celle-ci 11. Les résultats rapportent un
e�et marginal signi�catif (au seuil de 5%) pour les mois de janvier et de juillet, mais considérant
la grande taille de l'échantillon utilisé et le problème de p-value que celle-ci entraine, très
peu de foi peu être accordée à ces résultats. Qui plus est, l'e�et estimé varie de signe, et est
tellement faible qu'il devient pratiquement insigni�ant. À toutes �ns sensibles et contrairement
à l'intuition que l'on pourrait en avoir, cette variable ne semble avoir aucune in�uence sur la
décision d'arrêt.
De même, les variables de température, au moment où le chau�eur prend sa décision, ne
semblent pas avoir d'e�ets clairs. Ceci est particulièrement curieux pour la pluie, pour laquelle
je m'attendais à trouver un e�et marginal positif. Pour ces variables aussi, le signe varie d'un
mois à l'autre.
Ceci étant dit, toute estimation d'un modèle économétrique n'est que rarement parfaite. La
présente estimation, ainsi que toutes les autres régressions de mon mémoire, ne font pas exep-
tion. En e�et, plusieurs autre e�ets d'intéraction auraient pu être considérées. Un exemple
simple pourrait être celle du nombre d'heures travaillées avec la journée de la semaine. Malheu-
reusement, comme je l'ai mentionné plus tôt, l'utilisation d'une si importante base de données
impose au chercheur de devoir faire certains choix en ce qui a trait aux paramètres estimés et
aux méthodes utilisées. D'autre facteurs, ceux-ci inobservés dans les données, pourraient avoir
un pouvoir explicatif sur la décision des chau�eurs. Par exemple, le comportement des clients
lors des courses, ou encore la destination de la dernière course e�ectuée 12. La considération
de ces di�érentes di�cultées pourrait potentiellement ammener des changements quant aux
e�ets estimés.
En ce qui a trait à l'e�et du jour de la semaine, il semble que les jeudi, vendredi et samedi
(évalués relativement au dimanche) a�chent des e�ets négatifs sur la probabilité d'arrêter de
11. Les résultats pour chaque mois sont présentés dans l'annexe.12. Crawford et Meng (2011) trouvent des e�ets signi�catifs positifs pour l'arrondissement de Brooklyn et
les aéroport Kennedy et LaGuardia
41
travailler. On peut chercher une explication à ces e�ets en argumentant une activité écono-
mique et sociale (achats de consommations, sorties, ...) plus forte lors de ces journées. Celle-ci
entraine à son tour une demande plus forte pour les services de taxi et les chau�eurs y ré-
pondent en conséquence. Toutefois, dans la mesure où il s'agit de quelquechose de prévisible,
la réaction des chau�eurs s'explique par les deux modèles ici opposés. Il ne s'agit donc pas
d'un argument en faveur de l'un d'eux.
En�n, contrairement à mes attentes, les fêtes incluses dans mon estimation n'ont pas, en
général, d'e�et important. Notamment, je prévoyais observer un e�et substantiel pour la Saint-
Valentin, qui n'a�che qu'une diminution dans la probabilité d'arrêt de -0,11% [-0,17% ; -
0,05%]. En fait, seules les fêtes de Noël, de la veille du Nouvel An et du Nouvel An a�chent
des e�ets qui sont suppérieur à 1%. Respectivement, ces e�ets sont de 1,46% [1,36% ; 1,56%],
1,38% [1,31% ; 1,46%] et 1,26% [1,19% ; 1,34%].
42
Table 4.8 � E�ets marginaux moyen d'une estimation probit, par mois, de la probabilitéd'arrêter de travailler à la �n d'une course
Mois Montant cumulé ($) Temps Cumulé (h) Pseudo R2
Janvier -0,0000847 *** 0,0130354 *** 0,2052(2,57e-06) (0,0000355)[-0,0000897 ; -0,0000796] [0,0129657 ; 0,013105]
Février -0,0000734 *** 0,0123272 *** 0,2128(2,47e-06) (0,0000363)[-0,0000783 ; -0,0000686] [0,012256 ; 0,0123984]
Mars -0,0000741 *** 0,0127671 *** 0,2124(2,32e-06) (0,0000346)[-0,0000787 ; -0,0000696] [0,0126992 ; 0,0128349]
Avril -0,0000693 *** 0,0128709 *** 0,2210(2,27e-06) (0,0000357)[-0,0000737 ; -0,0000648] [0,012801 ; 0,0129408]
Mai -0,0000241 *** 0,013085 *** 0,2249(2,14e-06) (0,0000369)[-0,0000283 ; -0,00002] [0,0130127 ; 0,0131573]
Juin -0,0000805 *** 0,0132294 *** 0,2197(2,57e-06) (0,000038)[-0,0000856 ; -0,0000755] [0,0131549 ; 0,0133039]
Juillet -0,000097 *** 0,0129531 *** 0,2124(2,75e-06) (0,0000375)[-0,0001024 ; -0,0000916] [0,0128796 ; 0,0130265]
Août -0,0000903 *** 0,0136269 *** 0,2058(3,06e-06) (0,0000404)[-0,0000963 ; -0,0000843] [0,0135476 ; 0,0137061]
Septembre -0,0000963 *** 0,0131787 *** 0,2191(2,52e-06) (0,0000375)[-0,0001012 ; -0,0000914] [0,0131051 ; 0,0132522]
Octobre -0,0000966 *** 0,0130487 *** 0,2239(2,48e-06) (0,0000362)[-0,0001015 ; -0,0000918] [0,0129777 ; 0,0131196]
Novembre -0,0001312 *** 0,0129984 *** 0,2078(2,56e-06) (0,0000375)[-0,0001363 ; -0,0001262] [0,0129249 ; 0,0130718]
Décembre -0,0001615 *** 0,0134362 *** 0,2018(2,57e-06) (0,0000377)[-0,0001665 ; -0,0001564] [0,0133623 ; 0,0135102]
*** signi�catif à 0,1% ; ** 1% ; * 5% ; ' 10%.
43
Conclusion
Pour résumer, ce travail démontre que le modèle de comportement avec préférences du type
reference-dependent ne semble pas adéquat pour expliquer le comportement d'un chau�eur
de taxi. En e�et, en analysant comment répond le marché à un épisode de mauvais temps,
j'ai constaté une augmentation de l'o�re de travail. Même en explorant pour une possible
hétérogénéité dans le comportement, aucun indice clairement en faveur de ce modèle n'a été
trouvé. Cette conclusion est d'ailleurs renforcée par l'utilisation de méthodes di�érentes. En
procédant par une estimation avec variables instrumentales, les résultats démontrent encore
une claire augmentation de l'o�re. En�n, en cherchant à évaluer les facteurs qui peuvent in-
�uencer la décision d'un chau�eur à arrêter de travailler, je constate un e�et négatif associé au
montant d'argent accumulé lors du quart de travail. En somme, toutes les méthodes économé-
triques utilisées donnent raison au modèle intertemporel. Je rejoins donc Farber (2015) dans
ses conclusions. D'ailleurs, mon étude me laisse croire que les élasticités négatives obtenues par
les auteurs qui m'ont précédé, notamment par Camerer et col (1997) et par Chou (2002), sont
plutôt causées par un mauvais choix d'instrument, ce qui aurait ampli�é le biais d'estimation
négatif.
Ceci étant dit, comme je l'ai mentionné lors de la présentation des modèles, l'intervalle de
salaire pour lequel le modèle reference-dependent peut être pertinent est relativement restreint.
Il est possible que les variations de salaire qui ont été observées tombent dans les � zones
intertemporelles �du modèle. Par conséquent, il reste une possibilité que les chau�eurs suivent
le modèle alternatif, mais sur un intervalle si court que je ne l'ai pas détecté.
Évidemment, les conclusions de ce travail ne s'appliquent qu'aux chau�eurs de taxi et il serait
hasardeux de généraliser à tous les travailleurs. En e�et, ce groupe de travailleurs est composé
de gens qui ont fait le choix de leur profession et qui sont potentiellement plus enclins au
travail que d'autres. De plus, il est possible que ces mêmes personnes a�chent une aversion
à la perte relativement faible. Malheureusement, les données retenues ne permettaient pas de
déterminer le niveau d'aversion des individus.
D'autres études ont été menées sur des groupes di�érents, et donnent plutôt raison à des
modèles avec préférences de type reference-dependent.
44
Bibliographie
TLC Trip Record Data, nov 2016. URL http://www.nyc.gov/html/tlc/html/about/trip_
record_data.shtml.
NEWA Hourly Weather Data Page, nov 2016. URL http://www.newa.cornell.edu/index.
php?page=hourly-weather.
Baum, C. F., M. E. Scha�er et S. Stillman. ivreg2 : Stata module for extended ins-
trumental variables/2SLS, GMM and AC/HAC, LIML and k-class regression, 2010.
http ://ideas.repec.org/c/boc/bocode/s425401.html.
Camerer, C., L. Babcock, G. Loewenstein et R. Thaler. Labor Supply of New York City
Cabdrivers : One Day at a Time. The Quaterly Journal of Economics, pages 407�441, may
1997.
Cameron, C. A. et P. K. Trivedi. Microeconometrics : Methods and Applications. Cambridge
University Press, 32 Avenue of the Americas, New York, NY 100013-2473, USA, eighth
edition, 2005.
Chang T. et T. Gross. How Many Pears Would a Pear Packer Pack if a Pear Packer Could
Pack Pears at Quasi-Exogenously Varying Piece Rates ? Journal of Economic Behavior and
Organization, 99 :1�17, 2014.
Chou, Yuan K. Testing Alternative Models of Labor Supply : Evidence from Taxi-Drivers in
Singapore. The Singapore Economic Review, 47, 2002.
Crawford, V.P. et J. Meng. New York City Cab Drivers' Labor Supply Revisited : Reference-
Dependent Preferences with Rational-Expectations Targets for Hours and Income. American
Economic Review, 101 :1912�1932, 2011.
Daniel Kahneman, Jack L. Knetsch et Richard H. Thaler. Experiemental Tests of the Endow-
ment E�ect and the Coase Theorem. Journal of Political Economy, 98(6) :1325�1348, dec
1990.
Deb, Partha. Fmm - module to estimate �nite mixture models, 2012.
http ://fmwww.bc.edu/RePEc/bocode/f.
45
Doran, Kirk B. Are Long-term Wage Elasticities of Labord Supply More Negative than Short-
term Ones ? Economics Letters, 122(2) :208�210, 2014.
Farber, Henry S. Is Tomorrow Another Day ? The Labor Supply of New York City Cabdrivers.
Journal of Political Economy, 113(1) :46�82, 2005.
Farber, Henry S. Reference-Dependent Preferences and Labor Supply : The Case of New York
City Taxi Drivers. American Economic Review, 98(3) :1069�1082, jun 2008.
Farber, Henry S. Why You Can't Find a Taxi in the Rain and Other Labor Supply Lessons
from Cab Drivers. The Quaterly Journal of Economics, 130(4) :1975�2026, jul 2015.
Fehr, E. et L. Goette. Do Workers Work More if Wages Are High ? Evidence from a Rando-
mized Field Experiment. American Economic Review, 97(1) :298�317, mar 2007.
Greene, William. Économétrie. Pearson, One Lake Street, Upper Saddle River, NJ 07 458,
États-Unis, seventh edition, 2011.
Jehle, G. A. et P. J. Reny. Advanced Economic Theory. Pearson, Edinburgh Gate, Harlow,
Essex CM20 2JE, third edition, 2011.
Kahneman D. et A. Tversky. Prospect Theory : An Analysis of Decision under Risk. Econo-
metrica, 47(2) :263�291, mar 1979.
Kahneman D. et A. Tversky. Choices, Values, and Frames. American Psychologist, 39 :
341�350, apr 1984.
K®szegi, B. et M. Rabin. A Model of Reference-Dependent Preferences. The Quaterly Journal
of Economics, 121(4) :1133�1165, nov 2006.
MaCurdy, Thomas E. An Empirical Model of Labor Supply in a Life-Cycle Setting. Journal
of Political Economy, 89(6) :1059�1085, 1981.
Mingfeng, L., H. C. Lucas Jr et G. Shmueli. Research Commentary- Too Big to Fail : Large
Samples and the p-value Problem. Information Systems Research, 24(4) :906�917, 2013.
Oettinger, Gerald S. An Empirical Analysis of the Daily Labor Supply of Stadium Vendor.
The Journal of Political Economy, 107(2) :360�392, apr 1999.
Scha�er, M. E. xtivreg2 : Stata module to perform extended IV/2SLS, GMM
and AC/HAC, LIML and k-class regression for panel data models, 2010.
http ://ideas.repec.org/c/boc/bocode/s456501.html.
Smyth, Padhraic. Note Set 4 : Finite Mixture Models and the EM Algorithm. URL http:
//www.ics.uci.edu/~smyth/courses/cs274/notes/notes4.pdf.
46
Stéphane Carcillo, Pierre Cahuc et André Zylberberg. Labor Economics. The MIT Press,
second edition, 2014.
Tversky A. et D. Kahneman. Loss Aversion in Riskless Choice : A Reference-Dependent Model.
The Quaterly Journal of Economics, 106 :1039�1061, nov 1991.
Whong, Christopher M. FOILing NYC's Taxi Trip Data, mar 2014. URL http://chriswhong.
com/open-data/foil_nyc_taxi/.
47
Annexe 1
Preuve mathématique du modèle reference-dependent
Soit la fonction d'utilité suivante, qui admet de l'aversion à la perte.
U(h) =
a(Y − T )− h1+σ si Y − T < 0
b(Y − T )− h1+σ si Y − T ≥ 0
Où Y = wh est le revenu, T est l'objectif de l'individu en terme de revenu, w est le salaire
horaire, h est le nombre d'heures travaillées, a > b > 0 sont des coe�cients qui servent à
contrôler l'utilité marginale avant et après l'atteinte de l'objectif et σ > 0 est un paramètre
a�ectant l'élasticité salaire de l'o�re.
� Si Y − T < 0 :
∂U
∂h= aw − (1 + σ)hσ = 0
aw = (1 + σ)hσ
h∗ =( aw
1 + σ
) 1σ
Cette équation nous donne l'o�re de travail. L'élasticité salaire de l'o�re est donnée
par :
48
∂h
∂w× w
h=
1
σ
( aw
1 + σ
) 1σ−1× a
1 + σ× w
h
=1
σ
( aw
1 + σ
) 1σ−1× aw
1 + σ× 1
h
=1
σh×( aw
1 + σ
) 1σ
=1
σ× h
h=
1
σ> 0
Ainsi à des niveaux de salaires qui ne permettent pas d'atteindre la cible que le tra-
vailleur se �xe, l'élasticité salaire de l'o�re de travail est positive. À ces niveaux de
salaires, il se comporte donc comme dans le modèle intertemporel. Une augmentaiton
du salaire entraine une augmentation des heures travaillées.
� Si Y − T > 0 :
Comme la seule di�érence avec le cas où Y −T < 0 est que le paramètre a est remplacé
par b, l'élasticité salaire de l'o�re est la même dans les deux cas. Ceci implique qu'à des
niveaux de salaire qui sont supérieurs à ceux nécéssaires pour l'atteinte de la cible, le
travailleur se comporte ici aussi de la même manière que pour le modèle intertemporel.
� Si Y − T = 0
Y = T
wh = T
h∗ =T
w
À des niveaux de salaires qui permettent d'atteindre la cible, mais pour lesquels le
travailleur attribue une valeur plus élevée à l'heure de loisir supplémentaire, l'o�re de
travail ne dépend que du montant �xé et du salaire.
∂h
∂w× w
h=−Tw2× w
T× w
= −1
49
Pour les niveaux de salaires intermédiaires, l'élasticité salaire de l'o�re est de -1. Ainsi,
une augmentation de salaire contenue dans cet intervalle fait en sorte que le travailleur
atteint son objectif plus rapidement. Puisqu'il attribue toujours une valeur supérieure
à son loisir, il arrêtera de travailler une fois l'objectif atteint.
50
Annexe 2
E�ets marginaux du modèle probit
Table .9 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de janvier
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000847 2.57e-06 -32.96 0.000 -.0000897 -.0000796Temps cumulé (h) .0130354 .0000355 366.73 0.000 .0129657 .013105Nombre de courses -.0002091 .0000156 -13.38 0.000 -.0002398 -.0001785Distance e�ecutée .0002473 5.15e-06 48.03 0.000 .0002373 .0002574Montant dernière course ($) .0010324 4.01e-06 257.30 0.000 .0010245 .0010403Salaire 5 dernières courses ($/h) 2.51e-09 1.14e-09 2.21 0.027 2.84e-10 4.75e-09Pluie (mm/h) -.0026939 .0001466 -18.38 0.000 -.0029813 -.0024066Vent (km/h) -.0000619 8.76e-06 -7.07 0.000 -.0000791 -.0000447Température (°F) .0001373 5.15e-06 26.69 0.000 .0001272 .0001474
JourLundi -.0194856 .0002093 -93.11 0.000 -.0198958 -.0190755Mardi .0027267 .0002375 11.48 0.000 .0022612 .0031922Mercredi .004452 .0002253 19.76 0.000 .0040103 .0048937Jeudi -.0008673 .0002251 -3.85 0.000 -.00013084 -.0004261Vendredi -.0058382 .0002239 -26.08 0.000 -.006277 -.0053994Samedi -.016716 .0002099 -79.65 0.000 -.0171274 -.0163046
FêtesNouvel An .0126158 .0003865 32.64 0.000 .0118583 .0133733
Période du jourAprès-midi .0294706 .0001404 209.93 0.000 .0291955 .0297458Soir .0078643 .0001318 59.68 0.000 .007606 .0081226Nuit .0645512 .0002286 281.13 0.000 .0641011 .0650012
51
Table .10 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de février
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000734 2.47e-06 -29.77 0.000 -.0000783 -.0000686Temps cumulé (h) .0123272 .0000363 339.35 0.000 .012256 .0123984Nombre de courses -.0001394 .0000151 -9.23 0.000 -.000169 -.0001098Distance e�ecutée .0002273 4.97e-06 45.78 0.000 .0002176 .0002371Montant dernière course ($) .0010434 4.02e-06 259.72 0.000 .0010356 .0010513Salaire 5 dernières courses ($/h) -4.70e-09 4.11e-09 -1.14 0.253 -1.28e-08 3.36e-09Pluie (mm/h) .0066433 .0000979 67.83 0.000 .0064513 .0068352Vent (km/h) -.0004836 9.36e-06 -51.65 0.000 -.0005019 -.0004652Température (°F) -.000232 8.47e-06 -27.40 0.000 -.0002486 -.0002154
JourLundi -.018356 .0002136 -85.93 0.000 -.0187747 -.0179373Mardi .005465 .0002381 21.62 0.000 .0046799 .0056131Mercredi .0022071 .0002265 9.74 0.000 .0017632 .0026511Jeudi -.0019776 .000231 -8.56 0.000 -.00024303 -.0015249Vendredi -.0042231 .0002163 -19.52 0.000 -.0046471 -.0037992Samedi -.0174945 .0002028 -86.26 0.000 -.017892 -.0170969
FêtesSaint-Valentin -.0011312 .0002995 -3.78 0.000 -.0017182 -.0005443Super Bowl -.0051025 .000311 -16.41 0.000 -.005712 -.004493
Période du jourAprès-midi .0319713 .0001476 216.55 0.000 .031682 .0322607Soir .0061692 .0001326 46.53 0.000 .0059093 .0064291Nuit .0584628 .0002271 257.46 0.000 .0580178 .0589079
52
Table .11 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de mars
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000741 2.32e-06 -31.97 0.000 -.0000787 -.0000696Temps cumulé (h) .0127671 .0000346 368.75 0.000 .0126992 .0128349Nombre de courses -.000117 .0000143 -8.19 0.000 -.000145 -.000089Distance e�ecutée .0002211 4.66e-06 447.47 0.000 .000212 .0002303Montant dernière course ($) .0010529 3.72e-06 282.66 0.000 .0010456 .0010602Salaire 5 dernières courses ($/h) 9.49e-09 1.15e-09 0.82 0.411 -1.31e-08 3.21e-08Pluie (mm/h) .0011626 .0001303 8.92 0.000 .0009073 .0014179Vent (km/h) -.0001406 7.80e-06 -18.03 0.000 -.0001559 -.0001254Température (°F) -.00008 9.88e-06 -8.09 0.000 -.0000994 -.0000606
JourLundi -.0198673 .0002136 -93.01 0.000 -.0202859 -.0194486Mardi .0041913 .0002529 16.57 0.000 .0036956 .004687Mercredi .0031855 .0002402 13.26 0.000 .0027147 .0036562Jeudi -.0027477 .000224 -12.27 0.000 -.0031867 -.0023086Vendredi -.0086393 .0002093 -41.27 0.000 -.0090495 -.008229Samedi -.018698 .0002041 -91.61 0.000 -.019098 -.018298
FêtesPâque .0041604 .0003688 11.28 0.000 .0034377 .0048832
Période du jourAprès-midi .030823 .0001474 209.08 0.000 .0305341 .031112Soir .0032265 .0001319 24.46 0.000 .0029679 .003485Nuit .0519271 .0002104 246.79 0.000 .0515147 .0523395
53
Table .12 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois d'avril
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000693 2.27e-06 -30.54 0.000 -.0000737 -.0000648Temps cumulé (h) .0128709 .0000357 360.69 0.000 .012801 .0129408Nombre de courses -.0001233 .0000144 -8.54 0.000 -.0001515 -.000095Distance e�ecutée .0002138 4.50e-06 47.51 0.000 .000205 .0002226Montant dernière course ($) .0010481 3.72e-06 281.81 0.000 .0010409 .0010554Salaire 5 dernières courses ($/h) 3.22e-09 1.04e-08 0.31 0.758 -1.72e-08 2.37e-08Pluie (mm/h) .0012708 .0001387 9.17 0.000 .0009991 .0015426Vent (km/h) .0001154 9.02e-06 12.79 0.000 .0000977 .000133Température (°F) .0000629 6.01e-06 10.47 0.000 .0000511 .0000747
JourLundi -.0216762 .0002038 -106.38 0.000 -.0220755 -.0212768Mardi .002163 .0001811 11.94 0.000 .001808 .002518Mercredi .0008522 .0001884 4.52 0.000 .000483 .0012215Jeudi -.00321 .0001876 -17.11 0.000 -.0035777 -.0028423Vendredi -.0086478 .0001882 -45.95 0.000 -.0090167 -.0082789Samedi -.0201917 .0001974 -102.26 0.000 -.0205787 -.0198047
Période du jourAprès-midi .0361112 .0002191 164.82 0.000 .0356818 .0365406Soir .0069418 .0002339 29.68 0.000 .0064835 .0074002Nuit .0577024 .0002372 243.28 0.000 .0572375 .0581673
54
Table .13 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de mai
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000241 2.14e-06 -11.30 0.000 -.0000283 -.00002Temps cumulé (h) .013085 .0000369 354.64 0.000 .0130127 .0131573Nombre de courses -.0002827 .0000142 -19.92 0.000 -.0003106 -.0002549Distance e�ecutée .0001162 4.21e-06 27.58 0.000 .000108 .0001245Montant dernière course ($) .0010853 3.70e-06 293.22 0.000 .000108 .0001245Salaire 5 dernières courses ($/h) 6.37e-09 3.60e-9 1.77 0.077 -6.87e-10 1.34e-08Pluie (mm/h) -.0000628 .000033 -1.90 0.057 -.0001274 1.83e-06Vent (km/h) .0002533 9.56e-06 26.48 0.000 .0002345 .000272Température (°F) -.0001286 5.86e-06 -21.94 0.000 -.0001401 -.0001171
JourLundi -.0178836 .0002242 -79.75 0.000 -.0183231 -.0174441Mardi .0048398 .0002502 19.34 0.000 .00434=94 .0053301Mercredi .0037993 .0002374 16.01 0.000 .0033341 .0042646Jeudi .0004309 .0002377 1.81 0.070 -.000035 .0008968Vendredi -.0058183 .000226 -25.75 0.000 -.0062611 -.0053754Samedi -.0152113 .0002229 -68.26 0.000 -.0156481 -.0147745
FêtesJour du souvenir .0048001 .0004133 11.61 0.000 .00399 .005602
Période du jourAprès-midi .0315834 .0001506 209.73 0.000 .0312882 .0318785Soir .0023434 .0001349 17.37 0.000 .0020789 .0026078Nuit .0596051 .0002221 268.35 0.000 .0591697 .0600404
55
Table .14 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de juin
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000805 2.57e-06 -31.29 0.000 -.0000856 -.0000755Temps cumulé (h) .0132294 .000038 348.04 0.000 .0131549 .0133039Nombre de courses -.0000816 .0000162 -5.03 0.000 -.0001135 -.0000498Distance e�ecutée .0002545 5.22e-06 48.75 0.000 .0002442 .0002647Montant dernière course ($) .0010968 3.93e-06 279.21 0.000 .0010892 .0011045Salaire 5 dernières courses ($/h) 3.77e-09 7.72e-08 0.49 0.625 -1.14e-08 1.89e-08Pluie (mm/h) -.0017062 .0000415 -41.08 0.000 -.0017877 -.0016248Vent (km/h) -.0001055 .0000107 -9.86 0.000 -.0001265 -.0000845Température (°F) -.0002951 8.88e-06 -33.22 0.000 -.0003126 -.0002777
JourLundi -.0196635 .0002171 -90.55 0.000 -.0200891 -.0192379Mardi .0024254 .000213 11.38 0.000 .0020079 .002843Mercredi .0002119 .0002133 0.99 0.321 -.0002062 .00063Jeudi -.0023821 .0002133 -11.17 0.000 -.0028002 -.001964Vendredi -.0058988 .0002138 -27.59 0.000 -.0063178 -.005498Samedi -.0153532 .0002068 -74.24 0.000 -.0157585 -.0149479
Période du jourAprès-midi .0424887 .000234 181.58 0.000 .0420301 .0429473Soir .0038488 .0002517 15.29 0.000 .0033554 .0043422Nuit .0544469 .0002495 218.26 0.000 .0539579 .0549358
56
Table .15 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de juillet
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.000097 2.75e-06 -35.29 0.000 -.0001024 -.0000916Temps cumulé (h) 0.0129531 .0000375 345.62 0.000 .0128796 .0130265Nombre de courses -.0000111 .0000176 -0.63 0.526 -.0000455 .0000233Distance e�ecutée .0003048 5.64e-06 54.08 0.000 .0002937 .0003158Montant dernière course ($) .0011138 4.16e-06 267.55 0.000 .0011056 .0011219Salaire 5 dernières courses ($/h) 3.70e-08 1.31e-08 2.84 0.005 1.14e-08 6.26e-08Pluie (mm/h) .0000574 .0000667 0.86 0.390 -.0000734 .0001882Vent (km/h) -.000029 .0000117 -2.47 0.013 -.0000519 -6.00e-06Température (°F) 4.22e-06 8.32e-06 0.51 0.612 -.0000121 .0000205
JourLundi -.0170876 .0002041 -83.72 0.000 -.0174877 -.0166876Mardi .0041996 .0002154 19.50 0.000 .0037775 .004617Mercredi .0026784 .0002107 12.71 0.000 .0022654 .0030915Jeudi -.0018865 .0002324 -8.12 0.000 -.002342 -.0014311Vendredi -.0041417 .0002251 -18.40 0.000 -.0045829 -.0037006Samedi -.0128122 .0002085 -61.46 0.000 -.0132208 -.0124036
Fêtes4 Juillet .0023954 .0003981 6.02 0.000 .001615 .0031757
Période du jourAprès-midi .0368809 .001612 228.81 0.000 .036565 .0371969Soir .0037977 .0001391 27.30 0.000 .0035251 .0040703Nuit .0608719 .000232 262.41 0.000 .0604172 .0613265
57
Table .16 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois d'août
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000903 3.06e-06 -29.48 0.000 -.0000963 -.0000843Temps cumulé (h) .0136269 .0000404 336.91 0.000 .0135476 .0137061Nombre de courses -.000102 .0000188 -5.43 0.000 -.0001388 -.0000651Distance e�ecutée .0002545 6.15e-06 41.42 0.000 .0002425 .0002666Montant dernière course ($) .0011159 4.55e-06 245.40 0.000 .001107 .0011248Salaire 5 dernières courses ($/h) 2.21e-09 9.62e-09 0.23 0.819 -1.66e-08 2.11e-08Pluie (mm/h) -.0016103 .0000917 -17.57 0.000 -.00179 -.0014307Vent (km/h) -.0003545 .0000132 -26.95 0.000 -.0003803 -.0003287Température (°F) -.0000312 .0000147 -2.11 0.035 -.0000601 -2.26e-06
JourLundi -.0253568 .0002613 -97.03 0.000 -.025869 -.0248446Mardi -.0010735 .0002282 -4.70 0.000 -.0015208 -.0006262Mercredi -.0022048 .0002245 -9.82 0.000 -.0026448 -.0017648Jeudi -.0034753 .0002189 -15.88 0.000 -.0039043 -.0030463Vendredi -.0124749 .0002217 -56.27 0.000 -.0129094 -.0120404Samedi -.0189119 .0002317 -81.60 0.000 -.0193661 -.0184576
Période du jourAprès-midi .0363238 .0002449 148.35 0.000 .0358439 .0368038Soir -.0001038 .000255 -0.41 0.684 -.0006037 .000396Nuit .0544833 .0002551 213.54 0.000 .0539832 .0549833
58
Table .17 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de septembre
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000963 2.52e-06 -38.20 0.000 -.0001012 -.0000914Temps cumulé (h) .0131787 .0000375 351.27 0.000 .0131051 .0132522Nombre de courses .0000679 .0000162 4.18 0.000 .0000361 .0000997Distance e�ecutée .00029 5.16e-06 56.22 0.000 .0002799 .0003002Montant dernière course ($) .001057 3.87e-06 273.30 0.000 .0010494 .0010646Salaire 5 dernières courses ($/h) -5.43e-09 3.04e-09 -1.79 0.074 -1.14e-08 5.29e-10Pluie (mm/h) -.0023437 .0000492 -47.63 0.000 -.0024402 -.0022473Vent (km/h) .0005739 .0000123 46.76 0.000 .0005498 .0005979Température (°F) -.000215 7.82e-06 -27.49 0.000 -.0002303 -.0001997
JourLundi -.0187532 .0002121 -88.41 0.000 -.0191689 -.0183375Mardi .0043329 .0002443 17.74 0.000 .0038542 .0048117Mercredi .0057207 .0002518 22.72 0.000 .0052271 .0062143Jeudi .0016798 .0002377 7.07 0.000 .0012139 .0021457Vendredi -.0074377 .0002191 -33.95 0.000 -.007867 -.0070083Samedi -.0193631 .0002085 -92.86 0.000 -.0197718 -.0189544
FêtesFête du travail -.0027724 .0003899 -7.11 0.000 -.0035366 -.0020082
Période du jourAprès-midi .0351494 .000163 215.63 0.000 .0348299 .0354689Soir .0038419 .0001384 27.75 0.000 .0035706 .0041133Nuit .0565704 .0002202 256.88 0.000 .0561388 .057002
59
Table .18 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de octobre
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0000966 2.48e-06 -39.03 0.000 -.0001015 -.0000918Temps cumulé (h) .0130487 .0000362 360.29 0.000 .0129777 .0131196Nombre de courses .0000714 .0000158 4.51 0.000 .0000404 .0001025Distance e�ecutée .0002839 5.06e-06 56.08 0.000 .000274 .0002938Montant dernière course ($) .0010425 3.64e-06 286.44 0.000 .0010354 .0010496Salaire 5 dernières courses ($/h) -1.92e-08 2.11e-08 -0.91 0.361 -6.05e-08 2.20e-08Pluie (mm/h) -.0155228 .0005123 -30.30 0.000 -.0165268 -.0145188Vent (km/h) -.0004148 9.27e-06 -44.76 0.000 -.000433 -.0003966Température (°F) -.0001091 6.23e-06 -17.52 0.000 -.0001213 -.0000969
JourLundi -.0242271 .0002231 -108.61 0.000 -.0246643 -.0237899Mardi -.0002338 .0002014 -1.16 0.246 -.0006285 .0001608Mercredi -.0010047 .0001982 -5.07 0.000 -.0013932 -.0006163Jeudi -.004832 .0001972 -24.51 0.000 -.0052185 -.004455Vendredi -.0089877 .0002065 -43.53 0.000 -.0093924 -.0085831Samedi -.0227098 .0002147 -105.76 0.000 -.0231306 -.0222889
Période du jourAprès-midi .0417858 .0002212 188.90 0.000 .0413523 .0422194Soir .0071486 .0002374 30.11 0.000 .0066832 .007614Nuit .0590078 .0002381 247.80 0.000 .058541 .0594745
60
Table .19 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de novembre
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0001312 2.56e-06 -51.16 0.000 -.0001363 -.0001262Temps cumulé (h) .0129984 .0000375 346.89 0.000 .0129249 .0130719Nombre de courses .0002764 .0000167 16.57 0.000 .0002437 .0003091Distance e�ecutée .0003577 5.35e-06 66.83 0.000 .0003472 .0003682Montant dernière course ($) .0010786 3.93e-06 274.60 0.000 .0010709 .0010863Salaire 5 dernières courses ($/h) 8.12e-09 3.06e-09 2.65 0.008 2.12e-09 1.41e-08Pluie (mm/h) .0035132 .0000888 39.55 0.000 .0033391 .0036973Vent (km/h) -.0002982 .0000101 -29.66 0.000 -.0003179 -.0002785Température (°F) -.0004047 6.05e-06 -66.92 0.000 -.0004166 -.0003929
JourLundi -.0223708 .0002188 -102.23 0.000 -.0227997 -.0219419Mardi .0011409 .0002455 4.65 0.000 .0006597 .0016221Mercredi .0001232 .0002443 0.50 0.614 -.0003557 .0006021Jeudi -.0022809 .0002538 -8.99 0.000 -.0027782 -.0017835Vendredi -.0070389 .0002261 -31.13 0.000 -.0074821 -.0065956Samedi -.0186801 .0002115 -88.30 0.000 -.0190947 -.0182655
FêtesAction de Grâce .0004946 .0003833 1.29 0.197 -.0002566 .0012458
Période du jourAprès-midi .0346406 .0001539 225.08 0.000 .0343389 .0349422Soir .0038498 .0001389 27.72 0.000 .0035776 .004122Nuit .0527213 .0002179 241.90 0.000 .0522941 .0531485
61
Table .20 � E�ets marginaux moyen d'une estimation probit de la probabilité d'arrêter detravailler à la �n d'une course pour le mois de décembre
Regresseur E�et marginal Écart-type Statistique Z P-value IC à 95%
Montant cumulé ($) -.0001615 2.57e-06 -62.83 0.000 -.0001665 -.0001564Temps cumulé (h) .0134362 .0000377 355.95 0.000 .0133623 .0135102Nombre de courses .0004242 .0000173 24.58 0.000 .0003904 .0004581Distance e�ecutée .000407 5.43e-06 74.97 0.000 .0003963 .0004176Montant dernière course ($) .0011117 3.95e-06 281.12 0.000 .001104 .0011195Salaire 5 dernières courses ($/h) -3.45e-09 2.36e-09 -1.46 0.144 -8.07e-09 1.17e-08Pluie (mm/h) -.0017386 .0000742 -23.42 0.000 -.0018841 -.0015931Vent (km/h) -.0005146 9.99e-06 -51.51 0.000 -.0005341 -.000495Température (°F) -.0000344 5.75e-06 -5.99 0.000 -.0000457 -.0000232
JourLundi -.0133969 .0002021 -66.30 0.000 -.0137929 -.0130008Mardi .0060917 .0002333 26.11 0.000 .0056345 .0065489Mercredi .0023105 .0002423 9.54 0.000 .0018356 .0027854Jeudi .002022 .0002257 8.96 0.000 .0015796 .0024644Vendredi -.0045926 .0002134 -21.52 0.000 -.0050108 -.0041744Samedi -.012359 .0002079 -59.45 0.000 -.0127665 -.0119515
FêtesNöel .0146235 .0005129 28.51 0.000 .0136183 .0156287Veille du jour de l'an .0138434 .0003872 35.75 0.000 .0130846 .0146022
Période du jourAprès-midi .037166 .0001562 237.87 0.000 .0368597 .0374722Soir .0068311 .0001431 47.74 0.000 .0065507 .0071115Nuit .0559786 .0002172 257.78 0.000 .055553 .0564043
62