Dossier et recherche INED - n°86

Embed Size (px)

Citation preview

AVANT-PROPOS

Ce numro 86 de Dossiers et Recherches de l'Ined inaugure une srie intitule "Les sminaires de la valorisation de la recherche".

L'unit de la valorisation de la recherche a t cre, en novembre 1997, par Jean-Claude Sebag, l'initiative de Patrick Festy et Marcel Szwarc. L'anne 1998 a t celle de la mise en place de l'unit et du dmnagement de l'ensemble de l'Ined dans les nouveaux locaux du boulevard Davout. Une table ronde a t organise pour l'inauguration, le 14 septembre 1998, Salle Sauvy, sur le thme de "La place de l'expert en sciences sociales dans le dbat public" (les actes1 de cette runion ont t publis en Juin 1999 dans cette collection numro 78).

Les sminaires de la valorisation de la recherche proprement dits ont commen dcembre 1998 sur le thme des "Consquences conomiques et sociales du vieillissement". le Leur objectif est de faire connatre les travaux de dmographie et des disciplines connexes un public aussi large que possible. Des reprsentants des entreprises publiques et prives, de diffrentes administrations de certains organismes, des membres des professions librales, des enseignants, des tudiants (en cours de doctorat ou de diplmes d'tudes spcialises), des membres du secteur associatif et quelques chercheurs ont constitu la majorit des auditeurs (cf annexe 1). Isabelle Virem, de dcembre 1997 dcembre 1998, puis Cline Perrel, depuis le printemps 1999, en ont assur la coordination et le secrtariat. 1er

Aujourd'hui, nous organisons six neuf sminaires par an donnant lieu quatre cinq dossiers. Ces derniers sont constitus, soit partir de documents proposs par les intervenants, soit en utilisant l'enregistrement des exposs et des dbats. Ces dossiers ne constitueront jamais un procs verbal rigoureux de ce qui a t dit. Les auteurs, en respectant certains dlais ncessaires la publication, peuvent en modifier le texte, dans sa forme, pour mieux l'adapter l'crit. Ces dossiers sont enrichis d'une bibliographie, le plus souvent prpare par le service de la documentation de l'Ined, tenant compte des propositions des intervenants, qui font parvenir galement une courte biographie bibliographie. On y adjoint le programme du sminaire et en annexe des articles ou documents dj publis qui valorisent le travail des intervenants. (Les dossiers des quatre1

Vous pouvez vous procurer ce document en crivant la valorisation de la recherche de l'Ined, bureau 610 L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 1

sminaires du 1er semestre 2000 sont en cours de prparation avec l'assistance de Brengre Charbonnier). Dans le proche avenir, le choix des thmes sera largi des zones gographiques, comme par exemple la Chine, l'Europe communautaire, le Moyen-Orient ou la Russie (cf annexe2). Des aspects plutt mthodologiques (mthode de collecte ou mthode de mesure) seront galement proposs, tout en conservant les mmes orientations : vulgarisation et mise disposition de travaux ou de savoir-faire pour un public large de non-dmographes ou pour des scientifiques de disciplines connexes. La ncessit de complter les exposs oraux par des documents crits est apparue vidente depuis un an : je tiens remercier pour cela Alain Monnier de l'Ined et Michel Berry organisateur de sminaire l'Ecole de Paris du "Management". Ce dossier 2 n 86 distribu exceptionnellement avant le sminaire correspondant, a pu tre constitu grce au travail de Cline Perrel et Jean-Jacques David et la participation active des intervenants, que je tiens ici remercier.

Le dlgu la valorisation de la recherche

Jean-Claude Sebag

2

Pour vous procurer ce dossier, crire l'Ined, Jean-Claude Sebag, bureau 610

2

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

TABLE DES MATIRES Avant-propos Table des matires Programme du sminaire Textes des intervenants p. 1 p. 3 p. 5 p. 7

1- Expos liminaire de Ren PADIEU : Mobiliser les donnes existantes : enjeux et p. 9 conditions p. 9 1.1) Avantages et particularits des collectes secondaires p. 12 1.2) Besoin de la recherche et protection de la vie prive p. 15 1.3) Dfinir les droits et devoirs 2- Grard LANG : Droit des donnes publiques, statistiques et administratives2.1 et 2.2) Fondements et principes 2.3) Les collectes 2.4) Contradictions des lois de transparence 2.5) Spcificit de la statistique publique 2.6) Conciliation des lois de transparence et transposition de la directive europenne 2.7) Accs aux donnes publiques 2.8) Un conflit transatlantique en rglement 2.9) Le rle du droit dans l'conomie de la socit mondiale de l'information

p. 17 p. 17 p. 17 p. 18 p. 18 p. 19 p 21 p. 21 p. 22

3- Michel-Louis LEVY : Le numro INSEE : de la mobilisation clandestine (1940) au projet Safari (1974) p. 23 p. 23 3.1) De la mcanographie dans les administrations p. 25 3.2) La mobilisation clandestine p. 26 3.3) Les perscutions raciales p. 28 3.4) La dclaration de domicile p. 29 3.5) La mobilisation en Algrie p. 31 3.6) Le service du travail obligatoire (S.TO.) p. 32 3.7) La numro de scurit sociale 4- Benot RIANDEY : La statistique 20 ans aprs la loi Informatique et Liberts p. 35

5- Franois HRAN : Un exemple d'utilisation de donnes administratives : les tudes longitudinales de l'INSEE sur la participation lectorale (1995-1998) p. 41

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

3

6- Guy DESPLANQUES : Le recensement, une opration statistique des fins administratives p. 51 p. 51 6.1) L'utilisation des fins administratives p. 52 6.2) Une garantie de qualit p. 52 6.3) Le recensement, une opration pleinement statistique ralise avec les mairies p. 53 6.4) Des enjeux parfois diffrents p. 53 6.5) de plus en plus partags p. 53 6.6) Une conception statistique insparable des utilisations rglementaires p. 54 6.7) Bibliographie 7- Jean-Louis LHERITIER : L'utilisation des DADS pour les tudes p. 55 dmographiques et sociales p. 55 7.1) Des dclarations exhaustives pour les employeurs et leurs salaris p. 56 7.2) Une grande richesse d'informations p. 56 7.3) L'accs aux DADS pour les chercheurs p. 57 7.4) Des exemples d'tudes ralises partir des DADS p. 60 7.5) Annexes 8- Pierre STROBEL : L'utilisation de donnes d'origine administrative : possibilits et limites, prcautions ncessaires et perspectives de dveloppement p. 63 9- Gilles EVRARD : Les statistiques des risques professionnels : descriptions et limites p. 67 p. 67 9.1) Le champs informationnel couvert p. 72 9.2) Le systme de remonte d'information p. 82 9.3) Les produits statistiques p. 84 9.4) Conclusions p. 84 9.5) Quelques rsultats chiffrs 10- Guy DESPLANQUES : L'utilisation du rpertoire des personnes pour l'tude des prnoms p. 89 ANNEXES 1- Liste des intervenants, organisateurs et participants ce sminaire 2- Liste des actions passes et futures de la valorisation de la recherche 3- Liste des intervenants et responsables depuis 2 ans et pour les prochains sminaires 4- Biographie des intervenants du 20 septembre 2000 5- Rsum des interventions du 20 septembre 2000 6- Bibliographie 7- Extraits de documents communiqus par Roxane Silberman4 L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

p. 93 p. 95 p. 101 p. 103 p. 105 p. 129 p. 135 p. 143

PROGRAMME9h00 - 9h30 : Accueil-caf par Brengre Charbonnier et Cline Perrel 9h30 - 9h40 : Jean-Claude SEBAG (INED) Bienvenue et prsentation de la journe 9h40 - 10h00 : Ren PADIEU (INSEE et SFdS) Mobiliser les donnes existantes : enjeux et conditions 10h00 - 10h20 : Grard LANG (INSEE) Droits et devoirs de l'administration vis--vis des citoyens : les lois CADA, CNIL et archives 10h20 - 10h50 : Dbat anim par Franois Hran, puis pause 10h50 - 11h10 : Michel-Louis LVY (Secrtariat d'Etat l'Industrie) Le numro INSEE : de la mobilisation clandestine (1940) au projet Safari (1974) 11h10 - 11h30 : Benot RIANDEY (INED) La statistique 20 ans aprs la loi "Informatique et liberts" 11h30 - 11h50 : Franois HRAN (INED) Un exemple d'utilisation de donnes administratives : les tudes longitudinales de l'INSEE sur la participation lectorale (1995 - 1998) 11h50 - 12h20 : Conclusions de la matine par Franois Hran, puis repas 14h20 - 14h40 : Guy DESPLANQUES (INSEE) Le recensement, une collecte statistique des fins administratives 14h40 - 15h00 : Jean-Louis LHRITIER (INSEE) Les DADS : une source privilgie pour les tudes sur le march du travail 15h00 - 15h20 : Pierre STROBEL(MiRe) L'utilisation de donnes d'origine administrative : possibilits et limites, prcautions ncessaires et perspectives de dveloppement 15h20 - 16h00 : Dbat anim par Jean-Claude Sebag, puis pause 16h00 - 16h20 : Gilles VRARD (CNAMTS) Les statistiques des risques professionnels : descriptions et limites 16h20 - 16h40 : Guy DESPLANQUES L'histoire des prnoms travers le rpertoire des personnes 16h40 - 17h00 : Roxane SILBERMAN (LASMAS) Conclusions de la journe 17h00 - 18h00 : discussion gnrale anime par Jean-Claude SebagL'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 5

6

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

TEXTES DES INTERVENANTS

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

7

8

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

- Ren PADIEU - Inspecteur gnral de l'INSEE - Prsident de la commission de dontologie de la Socit Franaise de Statistique I- Expos liminaire : Mobiliser les donnes existantes : enjeux et conditions

Introduction La statistique repose sur des donnes individuelles. Pourtant, elle ne sintresse pas aux individus. Auxiliaire de beaucoup de disciplines des sciences humaines (mais dautres aussi : agronomie, biologie, ...) et de beaucoup de dcisions stratgiques (politiques, commerciales, etc.) elle ne vise qu dcrire globalement des situations ou qu tayer des jugements densemble. Pour autant, la possibilit de recueillir et traiter ces donnes individuelles ne va pas toujours de soi et des rgles de divers ordres sont observer. Il sagit ici principalement de la statistique portant sur des populations humaines. Mais, dautres units statistiques peuvent tre envisages : animaux, cultures, lments matriels ou immatriels. Les aspects techniques qui vont tre voqus peuvent aussi concerner ces units ; et, une partie des questions thiques ou juridiques sont galement communes, dans la mesure o sont en cause les intrts ou comportements des personnes, entreprises ou organismes qui en sont propritaires. Cependant, le cur des problmes qui vont tre voqus concerne les donnes relatives la personne humaine : raison de son intgrit, de sa dignit ou de ses intrts. - Une premire section va envisager, dun point de vue technique, les caractristiques, lintrt et les contraintes de lutilisation secondaire des donnes. - Une deuxime section examinera les problmes ns du croisement de deux exigences : lintrt de la recherche et la protection des personnes. Des voies de solution seront signales. Cet examen restera toutefois gnral, laissant aux autres interventions de cet atelier de dvelopper tel ou tel aspect. - Enfin, une troisime section sinterrogera sur la dynamique par laquelle les rgles sont engendres et les traitements particuliers dcids et conduits. 1- Avantages et particularits des collectes secondaires Le statisticien a essentiellement trois faons de se procurer les donnes dont il a besoin : - lenqute : on sadresse chacune des personnes sur qui on souhaite des renseignements. On lui soumet un questionnaire et lon enregistre ses rponses. Se rattachent ce mode de recueil, dune part, le cas o la personne concerne ne rpond pas par elle-mme (la rponse est fournie par quelquun de son entourage), dautre part, lexprimentation : o lon ne se contente pas dobserver ltat, laction ou lopinion des sujets, mais on leur applique dabord un stimulus, un traitement, afin dobserver la modification exprimentalement induite. Toutes ces enqutes peuvent se faire par observation unique dun mme sujet ou par passages multiples aussi appels suivi ou observation de panel ;L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 9

-

lobservation directe : selon cette modalit, les personnes nont pas participer au recueil de linformation. Elles sont observes, parfois leur insu, par quelquun qui enregistre leur allure ou leurs faits. Ce sont les comptages routiers, la mesure de la frquentation de muses, etc. ; ou encore la tldtection, cest dire lanalyse de photos ariennes ou satellitaires ; - la collecte secondaire : cette modalit met profit le fait que les personnes ont dj t observes ou interroges, ou quelles ont fourni spontanment des renseignements loccasion dune activit ou dune dmarche. Cet enregistrement primaire navait le plus souvent pas une vise de statistique ou de recherche, mais une vise administrative, commerciale, sanitaire, judiciaire, etc. Quelquun, un organisme se trouve donc dtenteur dun stock dinformation portant sur un grand nombre de personnes : lide est de mettre celui-ci profit pour des analyses statistiques. Dans les trois cas, les donnes ainsi recueillies formeront un fichier, sur lequel divers traitements systmatiques permettront, dabord, de vrifier linformation, puis dtablir des rsultats synthtiques (proportions, moyennes, dispersions, corrlations, typologies, etc.). Cest la troisime de ces faons de procder qui est lobjet de cette journe. Par comparaison avec les deux autres (que lon appelle collectes primaires) quels en sont les avantages ? Et, en revanche, les inconvnients ? 1.1) Avantages Avantage conomique. Le travail de collecte tant dj fait, on spargne de concevoir et imprimer des questionnaires, de former et rtribuer des enquteurs, de saisir les donnes. Quant la qualit de celles-ci, on profite galement que le premier collecteur a pu exercer certains contrles. Dune part, il a pu s'assurer de leur fourniture effective : parce quil bnficiait dun moyen de contrainte, ou bien que les personnes avaient un intrt les fournir, ou encore que ce premier collecteur ait pris la peine de les inciter rpondre. Dautre part, il a pu vrifier lexactitude et la sincrit des donnes. On dispose alors, tout constitu, dun fichier de qualit. Gain de temps. Une collecte suppose parfois un dlai apprciable : pour la prparer, y prparer les personnes interroges, conduire les oprations denregistrement et de contrle. Ici, un gisement dinformations prexiste : on entre directement dans la phase dexploitation et de production de rsultats. Rtrospective. Lorsquune tude doit prendre une vue rtrospective., les vnements passs ntant par hypothse plus observables, on est heureux quexiste une archive : soit quon lexploite pour elle-mme, soit quon en couple les donnes avec celles denqutes actuelles. Se rattache ceci la possibilit dutiliser une base de donnes prexistante pour tirer lchantillon dune investigation nouvelle. Hormis mme lintrt du couplage qui vient dtre dit entre donnes anciennes et contemporaines, on sait quune des difficults dune enqute directe est dassurer la reprsentativit des observations. Ceci devient possible si on dispose dune base de sondage ; o, en outre, diverses caractristiques, mme anciennes, des units chantillonnes permettent de stratifier lchantillon ou de varier les taux de sondage. Scurit des donnes. Si elles sont confidentielles, la base de donnes que lon mobilise est entre les mains de moins de personnes que lors d'une collecte primaire. Elle est aussi physiquement concentre, ce qui rend plus efficaces les garanties juridiques et les protections matrielles. On peut mme, avant transmission lui faire subir des oprations danonymisation ou de cryptage. Tranquillit des personnes. Lon aurait pu commencer par l : ayant dj fourni linformation en cause, les personnes nont pas tre sollicites nouveau. Alors que les citoyens et les entreprises se plaignent de plus en plus de labondance des dclarations de tous ordres (dont la statistique, mais pour une part minoritaire), il est apprciable de pouvoir valoriser les donnes recueillies sans alourdir le fardeau pour les rpondants.

10

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

1.2) Inconvnients Nature impose des renseignements. Lutilisateur secondaire est tributaire de ce que le premier collecteur a voulu recueillir. Certaines donnes intressantes pour lanalyse quon a en vue nont peut-tre pas t collectes. Par exemple, on a le mtier, mais pas lanciennet ; le revenu imposable, mais pas les prestations sociales ; etc. Ou bien, les concepts ne sont pas exactement ceux dont on aurait besoin : on a le nombre denfants fiscalement charge, mais non celui des enfants vivant au foyer ; on a les dlits dclars la police, mais non les dlits effectifs ; on a les achats alimentaires et non la nutrition ; etc. Dautre part, la sincrit, que nous avons voque plus haut, peut fort bien faire dfaut en fonction de la finalit du recueil initial. Le chercheur devra donc faire un arbitrage entre le gain en cot, en dlai et en prcision que lui apporte le stock de donnes disponibles et la perte de pertinence pour lanalyse du phnomne auquel il sintresse. Dlai de disponibilit. Ce second inconvnient, quelques fois, est l'inverse de lavantage de dlai voqu plus haut : le collecteur primaire assure en priorit ses propres utilisations et les donnes ne deviennent disponibles pour la statistique quensuite. Besoin d'un accord. Cet inconvnient, dordre relationnel, tient la ncessit davoir laccord du premier dtenteur. Mme dans les cas o une disposition lgale nonce expressment que les administrations devront procurer lorganisme de recherche les donnes dont il a besoin, une ngociation spcifique est souvent ncessaire ; et, naboutit pas toujours. Support. Techniquement, une difficult peut aussi natre de lincompatibilit des supports de linformation. Secret. Enfin, des obstacles juridiques peuvent venir du fait que les donnes sont protges : soit de faon gnrale (lgislation Informatique et Liberts) soit par des secrets professionnels spcifiques (secret mdical, secret judiciaire, ...). Des habilitations sont parfois ncessaires. Une volution est en cours, jy reviens plus loin et M. Lang dveloppera davantage. Au total, on voit que des arguments trs forts militent en faveur de lutilisation secondaire des donnes dj recueillies. On voit aussi que ceci ne va pas sans des contreparties. Il faut donc, dans chaque cas faire la balance des pour et des contre. 1.3) Dveloppement des collectes secondaires Depuis longtemps, les statisticiens ont exploit des donnes administratives. Pour ne citer que quelques exemples concernant l'INSEE : - l'Institut reoit copie des dclarations d'tat civil et en tire une statistique de natalit, nuptialit et dcs. Et, pour cette dernire, en association avec l'INSERM, une statistique des causes de dcs ; - charg de tenir le rpertoire interadministratif des entreprises et tablissements, il s'en sert aussi pour tablir une statistique de l'appareil productif et des crations, fusions ou disparitions d'entreprises ; - il reoit copie des dclarations annuelles des salaires verss, adresses par les employeurs l'administration des impts et la Scurit Sociale, et publie une statistique des salaires en fonction de l'ge, de la catgorie socioprofessionnelle, de la branche, du lieu, etc. (M. Lhritier en parlera cet aprs-midi) ; - il utilise les dclarations fiscales mensuelles de chiffres d'affaires pour l'analyse de la conjoncture conomique ; - il utilise les permis de construire pour actualiser les bases de sondages (fondes principalement sur le recensement dmographique) en vue des diffrentes enqutes qu'il lance auprs des mnages (cf l'expos de Guy Desplanques) ; - il s'appuie sur les registres de la taxe d'habitation pour contrler la collecte du recensement de la population ; - etc. Hors de l'INSEE, d'autres statistiques sont assises sur des fichiers administratifs. Les deux plus notoires sont la statistique du commerce extrieur, issue des dclarations en douane, et celleL'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 11

du chmage qui repose sur les inscriptions l'ANPE. Egalement, dans diverses administrations, l'information de gestion est utilise par la statistique : statistique de l'enseignement ou statistique hospitalire, par exemple. Et ainsi de suite. De ces quelques exemples, on aura not que les bases de donnes ainsi mobilises sont parfois exploites pour en tirer des rsultats statistiques et parfois utilises pour amliorer une collecte directe de donnes auprs de la population. Avant den finir avec laspect technique des choses, il faut encore souligner que sil est intressant de mobiliser une base de donnes existante, lintrt est encore bien plus grand lorsquon peut en mobiliser plusieurs conjointement : si elles comportent les mmes individus, on peut en les appariant cumuler diverses sortes de donnes. Par exemple, coupler des donnes conomiques avec des donnes de sant, etc. Ceci ouvre des possibilits danalyse quaucune des sources primitives ne permettait. Il y faut bien entendu des conditions techniques, notamment lexistence dun identifiant commun aux sources que lon rapproche, tel quun numro national didentit ou que le nom, le prnom et ladresse, etc. Et, il faut que cet identifiant soit fiable : afin dviter les faux appariements, qui introduisent du bruit ou mme des biais qui peuvent fausser gravement les rsultats. Dans le mme temps, cette possible interconnexion nest pas forcment compatible avec la finalit ou les obligations qui psent sur les sources primaires : on y revient dans la section suivante. 2- Besoin de la recherche et protection de la vie prive On voit donc bien tout l'intrt de mobiliser pour la statistique des donnes dj recueillies; mme si on en voit aussi les limites. Mais, faut-il pour autant le permettre ? Ici, l'on est la croise de deux exigences : d'un ct, dvelopper la connaissance de la socit, pour l'avancement de la science, pour la pertinence des dcisions publiques ou prives et pour l'valuation de leurs effets ; de l'autre ct, puisqu'on manie l'information relative des personnes, ne pas leur causer de prjudice. 2.1) Une utilisation sans prjudice, devenue illgale A priori, les rsultats que l'on vise tablir ne disent rien daucune personne particulire. On ne pourra fonder sur eux aucun jugement ni aucune dcision concernant une personne nommment dsigne. Rien donc ne devrait entraver l'accs de la recherche aux donnes3. D'autant que la pertinence des donnes en question pour les objectifs de connaissance viss est de la comptence du statisticien, ventuellement de la communaut scientifique, mais en aucun cas de celle des personnes sur qui portent les donnes, ni de celle du pouvoir politique ou hirarchique. A bon droit donc, le statisticien ou le chercheur revendiquera la facult d'avoir accs ces donnes. Etant reconnu, toutefois : - que cette facult ne se justifie qu'autant que la recherche en vue a besoin des donnes en cause. C'est ce qu'on appelle parfois le principe de proportionnalit. On collecte ce dont on a besoin et non pas un peu plus : par curiosit exagre ou pour le cas actuellement non prvu o a servirait ; - que cette libert n'exclut pas sa responsabilit : responsabilit vis vis de ses mandants ou commettants pour un mauvais choix technique de son approvisionnement en donnes et pour les cots de tous ordres ; responsabilit vis vis des personnes concernes pour tout usage impropre ou prjudiciable des donnes.

Nous ne disons rien ici de l'opportunit de mener cette recherche : ce qui est un problme que l'on peut soulever, mais diffrent, d'ordre politique, qui se pose identiquement pour les enqutes directes et pour les exploitations secondaires, mais qui ne doit rien au statut des donnes personnelles.3

12

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

Cela tant, mme si le produit de la statistique est sans incidence directe4, le seul fait de dtenir des renseignements sur les personnes n'est pas forcment anodin. Deux objections peuvent tre faites : l'une, le risque qu'elles soient, outre leur usage statistique innocent, aussi utilises l'encontre des individus ; l'autre, le fait que, mme en l'absence d'utilisation prjudiciable, dtenir sur les gens une information leur insu serait une atteinte leur dignit d'tre humain. C'est surtout la premire objection qui est mise en avant ; mais la seconde est parfois prsente. On entre ici dans la question de la protection de la vie prive, par le biais de la protection des donnes personnelles (cf expos suivant de Grard Lang). Beaucoup des exemples cits plus haut (cf 1.3) sont anciens, remontant l'immdiat aprs-guerre, parfois mme avant. Jusque dans les annes 1970, ils ont pu se dvelopper sans rencontrer d'obstacle ni juridique, ni de principe. Le dveloppement de l'informatique rendait ces utilisations de plus en plus efficaces et conomiques. C'est alors que la perspective de leur dveloppement, mais aussi du dveloppement d'exploitations non plus seulement des fins statistiques, mais visant les personnes, a fait prendre conscience d'un possible "fichage gnralis" des citoyens. La loi "Informatique et Liberts", en 1978, est venue rglementer ces pratiques. Alors mme que les applications statistiques qui viennent d'tre voques n'avaient jamais entran de prjudices pour les personnes, elles se sont trouves illgales (du moins celles qui concernaient des personnes physiques) et il a fallu les rgulariser sous le contrle de la CNIL. En fait, la loi de 1978 ne le permettait pas et il a fallu une loi spciale, en dcembre 1986, pour autoriser l'INSEE et les services statistiques de l'Administration recevoir et traiter des fichiers administratifs (cf expos suivant de Benot Riandey). 2.2) Loyaut et principe de finalit Le principe est en effet, dsormais, que la collecte de donnes personnelles n'est possible que si les intresss y consentent ou bien si un acte public la rend obligatoire. Dans tous les cas, la collecte et lutilisation ultrieure des donnes doivent tre loyales. Le consentement doit tre obtenu grce une information approprie sur lutilisateur des donnes et les buts quil poursuit ; mais, mme si le consentement nest pas requis, les personnes concernes doivent tre informes. On voit tout de suite que, en cas d'utilisation secondaire non prvue initialement, il sera difficile de retourner prvenir tous les intresss. En outre, hormis la difficult matrielle, il y a gros parier que les citoyens ainsi avertis seraient fort surpris qu'on leur annonce cette utilisation statistique de leurs donnes. Comme ils les ont dj fournies et donc s'attendaient ce qu'une utilisation personnalise en soit faite, ils comprendront mal qu'on tienne leur dire qu'en plus on en fait des statistiques. Et mme, ce soin mis les avertir de quelque chose qui est sans porte pour eux risque de les inquiter : ne voyant pas le pril, et pour cause ! ils se demanderont ce que a cache... La plus grosse difficult, toutefois, a t l'invocation du principe de finalit. Selon ce principe, apparu avec la lgislation "Informatique et Liberts", les donnes personnelles qui sont collectes le sont en vue d'une utilisation explicite et ne peuvent tre utilises d'autres fins. Ceci aussi dcoule du principe de loyaut l'gard des personnes concernes. Une utilisation additionnelle peut constituer un "dtournement de finalit" et ce titre tre interdite par la loi et par la CNIL. Ainsi pos en termes de finalit, le problme s'analyse en deux : la statistique est-elle compatible avec la finalit d'un recueil initial (finalit administrative, commerciale, fiscale, etc.) ? et, si l'on admet l'exploitation statistique des donnes, comment se prmunir contre d'autres utilisations ? Voyons dabord la question de la compatibilit de finalits.4 Il ne s'agit que d'incidence directe, c'est dire ce qui peut affecter une personne du fait des donnes qui la concernent. Car, il est admis que le rsultat statistique puisse amener des dcisions de porte collective, dont les individus ressentiront des effets : effets positifs ou ngatifs. Vouloir le contraire serait dnier la statistique tout utilit sociale. Et, du reste, fondes ou non sur la statistique, les dcisions politiques, administratives ou commerciales affectent en tout tat de cause ces individus.

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

13

Les statisticiens arguaient que la finalit de la statistique est d'tablir des rsultats gnraux, qui ne menacent en rien l'intrt des personnes. La finalit de la protection des donnes instaure par la loi de 1978 est de prserver cet intrt. Rien donc dans l'utilisation statistique ne va l'encontre de ce que la loi garantit. Toutefois, formellement, la loi dit qu'on ne peut ajouter une finalit la finalit initiale. Mme si l'autorit de protection (la CNIL) pouvait convenir qu'en effet l'exploitation statistique ne violait pas l'esprit de la loi, elle ne pouvait autoriser ce que la loi excluait formellement. La question a t en partie rgle par la loi de 1986, voque plus haut. Mais, les seuls bnficiaires en sont l'INSEE et les services statistiques de l'Administration. En sont donc exclus d'autres organismes, notamment des instituts de recherche, tels que l'INED. Ceci, quand bien mme leurs travaux seraient d'intrt public et mme s'ils prsentent les mmes garanties que l'INSEE lui-mme. A fortiori, des institutions de droit priv n'y ont pas accs. Ce sont donc toutes sortes de recherches sur les transports, l'urbanisme, lachalandage, etc. qui sont gnes. La situation est reconnue quelque peu paradoxale et une nouvelle volution lgislative se dessine. La loi Informatique et Libert doit prochainement tre modifie, en conformit avec une directive europenne du 24 octobre 1995. Cette directive raffirme le principe de finalit, mais prvoit que l'utilisation des donnes des fins de statistique, de recherche ou d'histoire "n'est pas incompatible" avec la finalit premire de leur recueil. En l'tat actuel du projet de loi, cette disposition est prvue dans la loi franaise. Le problme est donc presque rsolu quant la lgalit d'une exploitation secondaire. Cela ne signifie pas un accs discrtionnaire des statisticiens aux bases de donnes administratives ou commerciales. Une ngociation pralable avec le primo-dtenteur est ncessaire (cf. I supra). Et, la CNIL a s'assurer que des utilisations non autorises sont exclues. C'est l'objet du point suivant. 2.3) Maintien des donnes dans lunivers statistique Si l'utilisation statistique est permise, tant qu'elle ne porte pas prjudice aux personnes concernes par les donnes traites, encore faut-il que cette utilisation soit exclusivement statistique. Ceci signifie que le statisticien qui reoit le fichier en cause, d'une part, s'engage ne rien en faire d'autre que des statistiques5 , d'autre part, ne les communiquera pas un tiers et, enfin, prendra toutes prcautions matrielles pour que les tiers ne puissent y accder. C'est ce qu'on appelle la "rgle du sens unique" : des donnes administratives peuvent tre utilises des fins statistiques, mais des donnes statistiques ne peuvent tre utilises des fins administratives commerciales, fiscales, judiciaires, politiques, etc. Or, des donnes d'origine administrative reues par la statistique deviennent des donnes statistiques : elles ne peuvent donc tre renvoyes un autre usage administratif. Ceci nous amne la question de l'anonymat. Il n'y aurait en fait aucun problme si les donnes pouvaient tre rendues anonymes. C'est dire si l'on ne pouvait retrouver les personnes qu'elles concernent6. Car, en principe, la statistique n'a pas besoin de l'identit des personnes. Toutefois : - on a parfois besoin de l'identit si l'on se propose de rinterroger les personnes,

5 En englobant, comme cela a t dit, dans l'usage statistique aussi bien l'tablissement immdiat de rsultats statistiques que l'utilisation des donnes pour dterminer une collecte de nouvelles donnes (contrle d'exhaustivit, base de sondage, etc.) 6 Dun point de vue juridique, si les donnes sont vritablement anonymes, elles perdent leur caractre de donnes personnelles et sortent du champ de la loi Informatique et Liberts. La CNIL , dans ce cas, se dclare non concerne ; mais, auparavant, elle demande tre sre que lanonymat est effectif. La Directive europenne prvoit cet gard que la ridentification ne pourrait tre obtenue que par des moyens disproportionns ou draisonnables : suffisamment dissuasifs pour que le risque soit en pratique exclu. Il faut aussi observer que des donnes ne sont pas forcment non-identifiables en elles-mmes : la possibilit de ridentification dpend parfois dinformations quon dtient par ailleurs.

14

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

- on souhaite parfois apparier deux sources d'origine diffrente ou, au sein d'une mme source (c'est par exemple le cas avec les dclarations annuelles de salaires) suivre les mmes personnes au cours du temps, - mme lorsque la statistique n'a pas besoin de l'identification des personnes, le dtail des donnes permet parfois de "ridentifier" les donnes, cest dire deviner de qui il s'agit : lorsque par exemple on connat le sexe, l'ge, l'adresse et la profession. Ainsi, parfois, on a besoin de l'identit et, parfois, lorsqu'on n'en a pas besoin et qu'on anonymise les donnes, elle peut nanmoins tre retrouve. Une solution est alors, soit d'interdire purement et simplement l'utilisation des donnes, soit de masquer ou regrouper les variables pour que l'anonymat soit protg. Par exemple, au lieu de l'ge en annes, on n'indiquera que trois ou quatre tranches d'ge, ou encore le dpartement, au lieu de l'adresse prcise : ce qui peut faire perdre l'analyse une prcision essentielle. Il y a heureusement une autre solution : elle consiste garder l'information dtaille et identifiable, mais mettre les protections ncessaires pour qu'elle ne soit pas utilise d'autres fins. Pour ce faire, il y a lieu de combiner des dispositions juridiques et matrielles. A la fois, l'autorisation d'accs au fichier ou l'engagement contractuel du statisticien lui interdit de faire ou laisser faire un usage non autoris des donnes ; et, de plus, celles-ci sont elles-mmes dtenues dans une enceinte ferme ou accessibles seulement avec des clefs logiques confidentielles. On peut aussi recourir des procds de cryptage ou de brouillage. L'appariement de fichiers demande un examen particulirement attentif. Dans ce cas, il est essentiel que l'information venant d'une source ne puisse tre rtrocde une autre Il faut ici distinguer la notion d'interconnexion de celle d'appariement : la premire permet un change d'informations entre les gestionnaires des deux bases de donnes ; la seconde respecte de part et d'autre la rgle du sens unique, les informations des deux sources venant constituer une troisime base de donnes qui n'est accessible qu'au statisticien. Ceci s'obtient par l'engagement formel d'apparier les donnes sans en renvoyer le rsultat aucune des deux sources, avec les prcautions matrielles correspondantes. Par prcaution supplmentaire, on recourt parfois la mthode dite "de double aveugle" : un organisme diffrent de celui qui analysera les donnes est charg de l'appariement, lui seul connat la correspondance entre les deux sources et il ne transmet l'utilisateur statistique que des donnes apparies mais anonymes. Nous voyons ainsi que les solutions juridiques et techniques existent pour assurer la protection des personnes tout en autorisant la recherche. Lgitimement attentive aux risques potentiels, la CNIL admet nanmoins ces reprises de donnes et mme les appariements pour autant que les dispositions juridiques, organisationnelles et matrielles sont suffisantes. 3- Dfinir les droits et devoirs Le contrle exerc par la CNIL a pu tre ressenti par certains statisticiens comme leur mettant "des btons dans les roues". En sens inverse, passe la surprise de se retrouver hors la loi pour des pratiques jusqu'alors tout fait admises, les statisticiens se sont rendu compte qu'en effet, le fait de dtenir des donnes personnelles (mme si eux n'en faisaient rien de prjudiciable) comportait certains risques pour les personnes et que donc des prcautions taient utiles. Ils se sont aperu aussi que, face la crainte du public envers les traitements de donnes lequel public ne fait du reste pas une distinction bien nette entre les applications vises personnelles et la recherche - ils ont tout intrt avoir la caution de l'autorit de contrle. S'ils ont vu parfois la CNIL leur faire des ennuis, ils ont moins t tmoins des cas o celle-ci pourtant, recevant les protestations d'un citoyen, lui expliquait que l'opration en cause n'avait rien de scandaleux ni rien de compromettant.

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

15

Dans ces conditions, que le statisticien ne soit pas livr son initiative dbride, mais qu'il ait justifier du besoin qu'il a des donnes et des prcautions qu'il prend leur gard est une saine discipline. De plus, les statisticiens prendraient parfois spontanment les dispositions ncessaires, mais ils peuvent se trouver dans des institutions ou entreprises dont la hirarchie, poursuivant d'autres enjeux que la neutralit scientifique et le respect des personnes, voudrait leur imposer des traitements ou leur refuser des prcautions. Dans ce cas, il leur est utile de pouvoir s'appuyer sur une contrainte externe : autorit de la loi ou usages professionnels. C'est l que je voudrais insister sur une dynamique parce que des rgles ne peuvent jamais avoir pourvu tout et qu'il faut donc sans cesse les interprter ou les faire voluer. Cette dynamique se joue sur trois niveaux la fois : celui de l'autorit publique (la loi et la CNIL), celui de la profession et celui de la conscience individuelle. En effet, quelques rgles collectives qui puissent exister, elles seraient impuissantes si la grande majorit des professionnels n'agissaient selon une thique qui allie la probit scientifique et le respect de l'Homme. Mais l'inverse, encore faut-il que ces professionnels aient des repres leur rflexion personnelle, des guides pour laborer leur conduite. A l'autre extrme, il est ncessaire que, dans une socit comme la ntre des rgles gnrales existent et que des organes appropris s'assurent de leur application. Nous venons d'voquer les avantages que les statisticiens eux-mmes peuvent y trouver quant la confiance du public et quant leur indpendance. Toutefois, ces rgles gnrales ne peuvent prendre en compte les particularits de toutes les activits. La statistique et la recherche ont des finalits propres et des techniques propres qui appellent une adaptation des rgles. Ici, la profession a un rle essentiel jouer. J'entends par "profession" la fois, d'une part, les diverses institutions, instituts, centres de recherche et entreprises, tant de statut public que priv, qui font de la statistique un titre ou un autre ; et, d'autre part les organisations au sein desquelles les statisticiens se retrouvent titre individuel et qui peuvent prendre du recul par rapport aux enjeux et contraintes que les institutions subissent. La communaut professionnelle dgage de l'exprience partage des rgles qui compltent les prescriptions gnrales, s'adaptent aux diverses situations de recherche et s'offrent donc comme rfrence aux statisticiens au cours de leur travail. Les institutions pour leur part, doivent tablir des procdures internes et, pour les cessions de donnes entre elles, elles doivent passer des conventions qui les lient7. Les organisations professionnelles de leur ct laborent des codes de dontologie (de bonne pratique) qui compltent les rgles publiques et unifient les pratiques professionnelles autour de standards reconnus. Simultanment, cette mme communaut professionnelle peut constater les inadaptations, excs ou insuffisances des rgles dictes par les pouvoirs publics : elle peut aider l'volution de celles-ci. La loi de 1951 qui rgit la statistique publique a t voulue et prpare par l'INSEE. Il en a t de mme de la loi de 1986 que j'ai voque. Il en a t de mme, au niveau europen, pour la prparation de la directive communautaire de 1995. C'est elle encore que la CNIL peut consulter, en dehors de l'instruction des projets statistiques particuliers, pour se faire une ide plus juste de l'tat de l'art. Voil donc mon sens comment s'articulent la loi, la dontologie et la conscience professionnelle, d'une faon gnrale pour tous travaux statistiques, mais particulirement pour ce qui nous intresse aujourd'hui : l'exploitation secondaire de donnes recueillies d'autres fins. Car dans ce cas se posent de faon plus aigu des questions essentielles quant au droit disposer de ces donnes et quant la protection des personnes.

7 en particulier, pour la cession d'un fichier ou l'accs une base de donnes des fins de statistique, la recommandation du Conseil de l'Europe de 1997 comporte qu'un contrat explicite entre l'organisme premier dtenteur et le bnficiaire stipule qui traitera et dans quel but les donnes transmises, prescrive les prcautions matrielles et interdise la cession un tiers.

16

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

- Grard LANG - Chef de la division Environnement Juridique de la Statistique l'INSEE II- Droit des donnes publiques, statistiques et administratives

1- En principe, toute demande d'information manant d'un service administratif en direction d'un citoyen ou d'une entreprise (personne physique ou morale) porte en germe une atteinte aux liberts publiques. C'est pourquoi une telle demande doit toujours reposer sur un fondement juridique. 2- Une fois le fondement juridique d'une collecte de donnes par l'administration assur, le principe de transparence de l'administration (mis en oeuvre par trois lois des annes 1978-1979 : la loi "Informatique et Liberts" [crant la CNIL], la loi sur la libert d'accs aux documents administratifs [crant la CADA] et la loi sur les Archives) assure l'accs lgitime de tout citoyen toutes les donnes dtenues par l'administration, sauf si une disposition explicite reposant sur un principe de secret dfini par la loi peut s'opposer cette transparence. 3- Les collectes systmatiques de donnes par les administrations empruntent essentiellement trois voies distinctes. 3.1) Collectes vises par le CNIS La premire voie est celle des donnes qui sont collectes par la voie des questionnaires statistiques. Ceux-ci mettent en uvre des enqutes statistiques, dont le programme annuel est fix par un arrt du ministre charg de l'conomie, aprs avis du Conseil national de l'information statistique (CNIL), en application de la loi n 51-711 du 7 juin 1951 modifie notamment par la loi n 86-305 du 23 dcembre 1986 sur l'obligation, la coordination et le secret en matire de statistiques. Ces enqutes peuvent tre nationales ou rgionales, obligatoires ou non obligatoires, exhaustives ou par sondage. Les questionnaires doivent recevoir l'avis de conformit du comit du label du CNIS. Dans tous les cas, les donnes collectes en application de la loi de 1951 sont protges par le secret statistique, qui s'oppose la divulgation des donnes individuelles et des donnes finement agrges (sauf drogation donnes aprs avis du comit du secret pour ce qui concerne les donnes relatives aux entreprises). 3.2) Collectes vises par le CERFA La voie "normale" d'une collecte administrative systmatique est celle du formulaire administratif. En principe un tel formulaire collecte des donnes que les "assujettis" (citoyens, entreprises) sont obligs de transmettre l'administration en vertu d'une loi et des textes rglementaires (dcrets, arrts) pris pour son application. Dans ce cas le formulaire porte le visa du CERFA (Centre d'Enregistrement et de Rvision des Formulaires Administratifs), qui doit vrifier le fondement juridique de la collecte des donnes figurant sur le formulaire et s'assurer deL'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 17

leur caractre "non-excessif". Une circulaire du Premier ministre du 6 mars 2000 relative la simplification des formalits et des procdures administratives rappelle ces principes avec une fermet inhabituelle. Tel est le cas des formulaires fiscaux (dclarations d'impts, ...) dont les donnes sont protges par le secret fiscal. Mais il est parfaitement possible qu'une collecte CERFA ne soit protge par aucune disposition relative au secret des donnes collectes par les textes qui en constituent le fondement juridique. 3.3) Autres collectes administratives La troisime voie est celle de la collecte "anormale" par l'administration, en tout amateurisme, de donnes individuelles auprs des citoyens ou d'entreprises sans fondement juridique explicite et prcis. Cette troisime voie, sans tre franchement illgale, est peu recommandable car : - en aucun cas les donnes individuelles ainsi collectes ne peuvent tre protges et tout citoyen le demandant la CADA y aura accs ; - la consommation de crdits publics occasionne par cette collecte sera souvent un gaspillage car nul n'aura vrifi que ces donnes ne sont pas disponibles ailleurs ; - l'atteinte aux liberts publiques pourra tre prsume l'encontre de l'administration ayant organis et financ cette collecte ; 4- Contradictions des lois de transparence En fait les trois lois de transparence comportent certaines contradictions dans leur application. Ainsi : - La CADA (Commission d'Accs aux Documents Administratifs) considrera que le support papier ayant servi la collecte de donnes administratives, mme nominatif, ne cre pas de prjudice la personne concerne en cas d'accs d'une tierce personne, l mme o la CNIL (Commission nationale de l'informatique et des liberts) considrera que les mmes donnes mises sur support lectronique, et dont on aura supprim le caractre directement nominatif, demeurent indirectement nominatives et doivent, ce titre, tre rendues inaccessibles sauf pour l'administration collectrice de ces donnes. - La DAF (Direction des Archives de France) considrera que des donnes, ayant t collectes sur fonds publics, font partie du patrimoine public et doivent ce titre tre verses aux Archives ds la fin de leur utilisation habituelle par l'administration collectrice, l o la CNIL dcidera, en examinant le traitement habituel de l'administration dpositaire concernant ces donnes, que celles-ci devraient tre dtruits l'issue d'un assez court dlai aprs ce traitement. 5- Spcificit de la statistique publique 5.1) Protection des donnes par le secret L'activit statistique a pour objectif la production de donnes agrges. mais elle ne peut se passer des donnes individuelles, qui sont de faon incontournable sa matire premire. C'est pourquoi les donnes collectes par la loi de 1951 sont protges par le secret statistique qui interdit la divulgation des donnes individuelles. Cette spcificit de l'activit statistique explique galement le privilge concd aux statisticiens publics, auxquels la loi n 86-1305 du 23 dcembre 1986, introduisant un article 7 bis dans la loi du 7 juin 1951, accorde la possibilit18 L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

d'accder toute collecte administrative de donnes individuelles (Cette possibilit n'est ni un droit automatique, ni une garantie de gratuit, mais un fondement juridique pour l'accs ces donnes). Il s'agit d'un sens unique ! Mme les services fiscaux ne peuvent accder aux donnes individuelles collects par les statisticiens. Seul un officier de police judiciaire, mandat par un juge d'instruction peut faire chec au secret statistique. Seul le comit du secret statistique peut autoriser l'accs des donnes individuelles relatives des entreprises, aprs avoir vrifi qu'en aucun cas ces donnes ne serviront la rpression conomique ou au contrle fiscal. Ainsi une administration ne peut, en principe et en application du principe de spcialit, accder aux donnes individuelles dtenues par une autre administration, mais seulement aux rsultats de traitements statistiques relatifs ces donnes. 5.2) Mlanges Signalons quun service statistique ministriel (i.e. : un service de ladministration auquel le CNIS reconnat la qualit de service statistique au sens de la loi de 1951) peut fort lgitimement pratiquer des collectes de formulaires administratifs CERFA. Cest le cas de la DARES (Direction de l'Animation de la Recherche et des Etudes Statistiques) pour les collectes de lESE (Enqute Structure des Emplois) et des DMMO (Dclaration des Mouvements de Maind'uvre) effectus en application du code du Travail. Cest aussi le cas de lINSEE, dans le cadre de la collecte interministrielle des DADS (Dclaration Annuelle des Donnes sociales). La collecte des donnes relatives ltat civil (qui dune part donne naissance la "statistique du mouvement de la population" calcule continment depuis la mobilisation, ds 1772 par labb Terray, des registres paroissiaux et dautre part nourrit le RNIPP) a galement une nature mixte : chacun des 7 supports papiers correspondant dispose soit du statut statistique, soit du statut administratif. 5.3) Les fichiers didentification et de souverainet Une composante essentielle de la mission de lINSEE, hrite de lhistoire, est la gestion de grands fichiers touchant la souverainet de lEtat : - Rpertoire National dIdentification des Personnes Physiques (RNIPP) - fichier lectoral - Rpertoire National des Entreprises et des Etablissements (SIRENE) Ces trois gestions sont, bien sr, de nature purement administrative. Mais la premire et la dernire fournissent des identifiants "uniques" relatifs : - aux personnes physiques (NIR du RNIPP) dune part ; - aux entreprises (SIREN) et aux tablissements (SIRET) dautre part ; qui sont dune grande utilit pour la statistique, notamment en permettant le chanage de donnes annuelles qui sert construire des fichiers "historiques" empilant ces donnes annuelles. En outre SIRENE sert de base de sondage lensemble de la statistique dentreprise. 6- Conciliation des lois de transparence et transposition de la directive europenne Aprs le constat (notamment par le Conseil dEtat dans son tude "La transparence et le secret" contenue dans le rapport public 1995) des contradictions voques au point 4, et devant la ncessit de transposer en droit franais la directive europenne du 24 octobre 1995 relative la protection des personnes physiques lgard du traitement des donnes caractre personnel et la libre circulation de ces donnes (ce qui aurait d tre fait pour le 24 octobre 1998 !), un mouvement de mise jour et dharmonisation des trois lois de transparence est en marche.L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 19

6.1) Loi DCRA La loi dite "DCRA" (Droit des Citoyens dans leurs Relations avec les l'Administrations) a t publie au Journal officiel du 13 avril 2000. Elle modifie la loi CADA en tendant les comptences de la Commission d'Accs aux Documents Administratifs : - aux supports autres que le papier, notamment le support lectronique ; - aux drogations aux dlais de protection concernant les donnes dposes aux Archives. La loi modifie galement la loi CNIL et la loi Archives afin d'harmoniser les dispositifs CNIL, CADA et Archives. Notamment, elle consolide (et tend) l'article 7 bis de la loi du 7 juin 1951 en prvoyant les modalits de conservation des donnes nominatives en vue de leur rutilisation des fins historiques, statistiques et scientifiques distinctes de la finalit initiale de leur collecte. Par ailleurs, elle tire galement les consquences de cette harmonisation pour ce qui concerne le code pnal. 6.2) Modification de la loi sur les Archives Un projet de loi modifiant la loi n 79-18 du 3 janvier 1979 sur les Archives est actuellement en cours de discussion au niveau interministriel. Son principal objectif est d'abaisser (parfois fortement), voire d'annuler, la dure des dlais de protection des donnes. Sa version initiale, annulant toute protection des donnes statistiques dposes aux Archives, a donn lieu une vive raction du CNIS. On semble s'orienter vers des solutions plus raisonnables. 6.3) Modification de la loi CNIL Un projet de loi modifiant la loi CNIL et transposant la directive europenne du 24 octobre 1995 a fait l'objet de 13 runions interministrielles en Juin-Juillet 1999. L'arbitrage final a t opr par un additif dat du 20 juin la runion finale de cycle, tenue le 27 juillet 1999. Le projet a t transmis la CNIL, pour avis. Le point le plus important de la directive dicte le principe selon lequel chaque collecte de donnes est effectue en vue d'une (ou plusieurs) finalit(s) explicitement dtermine(s) et que toute rutilisation de ces donnes d'autres fins est interdite. Toutefois la directive autorise chaque Etat membre, lors de la transposition, inscrire dans son droit interne et par drogation au principe de finalit prcdemment dict ( condition de prendre les garanties appropries) le fait que la rutilisation "ultrieure des fins historiques, statistiques ou scientifiques n'est pas rpute incompatible" avec la finalit initiale de la collecte. La France devrait inscrire cette drogation dans la loi de transposition, ce qui : - lgitime l'archivage historique des fichiers, - lgitime la rutilisation des donnes administratives individuelles par la statistique publique (article 7bis de la loi de 1951), mais ouvre aussi ventuellement la voie la statistique prive, - permet d'organiser l'accs des donnes individuelles administratives ou statistiques des fins de recherche scientifique (ce qui exige que cette finalit soit un peu plus prcisment dfinie), - met en uvre les modalits de conservation des donnes insres dans la loi DCRA.

20

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

7- Accs aux donnes publiques Plus gnralement, est en cause dans toute cette discussion le statut des donnes publiques, et le droit qui rgit leur accs et leur diffusion. Ces questions constituent un enjeu fondamental dans le cadre de la "socit de l'information" et du dveloppement explosif de l'Internet. Une initiative communautaire (initie par le commissaire Bangeman) coloration trs librale et fortement inspire des pratiques amricaines a donn lieu une contre-offensive de la majorit des Etats membres (dont la France). La situation actuelle, qui a fait l'objet d'un livre vert interrogatif de la Commission, est trs volutive. Ainsi l'avis du comit des rgions de l'Union europenne, en date du 17 novembre 1999, est trs balanc. En ce qui concerne la position de la France, on dispose de la rponse du gouvernement au livre vert de la Commission sur la socit de l'information et du rapport "Mandelkern" intitul "Diffusion des donnes publiques et rvolution numrique" rdig par l'Atelier "Des moyens nouveaux au services de la diffusion des donnes publiques" dans le cadre de la mission "l'Etat et les technologies de l'information et de la communication" confie Bruno Lasserre au sein du Commissariat Gnral du Plan. Sur des champs partiels on dispose, pour clairer les dcisions venir, du rapport "Silberman" intitul "Les sciences sociales et leurs donnes" et du rapport "Lengagne" intitul "Les perspectives d'volution de l'information gographique et les consquences pour l'IGN". On dispose galement, pour ce qui concerne des donnes relatives aux personnes physiques, du rapport "Braibant" intitul "Donnes personnelles et socit de l'information" demand par le gouvernement pour prparer la transposition de la directive du 24 octobre 1995. 8- Les donnes personnelles et les relations entre les Etats-Unis et l'Europe Ces questions constituent un enjeu de taille dans les relations entre l'Europe et les EtatsUnis. A la suite d'un accord intervenu lors de la visite de M. Clinton en Europe courant mai, le comit des reprsentants de l'Union europenne a approuv l'accord avec les Etats-Unis relatif aux donnes personnelles. Par cet accord l'Union reconnat en faveur des Etats-Unis la prsomption que leur lgislation est suffisamment protectrice des donnes personnelles pour autoriser les transferts de donnes individuelles dans le sens Europe-Etats-Unis. Cet accord intervient aprs de longues et houleuses ngociations, dans un climat envenim par les "rvlations" rcentes sur les coutes "Echelon", et aggrav par les ractions devenant de plus en plus fortes des consommateurs amricains devant la dsinvolture gnrale du "business" arcbout des principes d'autodiscipline assez peu convaincants, notamment la suite de l'affaire dite "Doubleclick", du nom d'une socit de publicit en ligne et de marketing direct qui a d renoncer, face au toll dclench par son projet, fusionner les informations individuelles systmatiquement recueillies sur le Net avec sa base de donnes Abaccus, qui contient des donnes marketing sur prs des deux tiers des foyers amricains. Ainsi, le Journal officiel des Communauts europennes du 25 aot 2000 publie trois dcisions de la Commission, dates du 26 juillet 2000, relatives respectivement : - la constatation du caractre adquat de la protection des donnes caractre personnel en Suisse ; - la constatation du caractre adquat de la protection des donnes caractre personnel en Hongrie ;

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

21

- et, la pertinence de la protection assure par les principes de la "sphre de scurit" et par les questions souvent poses y affrentes, publies par le ministre du commerce des Etats-Unis d'Amrique. Ces trois dcisions, mais plus particulirement celle relative aux USA (dont les 7 annexes remplissent 38 pages du JOCE), sont rdiges de faon trs nuances et pleines de mesures d'application et prvoient mme des "cas de force majeure" pouvant dispenser les Etats membre de leur application. En outre la mise en ligne sur Internet, pas les mormons, des informations relatives l'tatcivil qu'un accord avec les Archives de France leur avait autoris copier sur micro-fiches a soulev rcemment une certaine motion. 9- Le rle du droit dans l'conomie de la socit mondiale de l'information L'information (sa collecte, son stockage, son traitement, son change) sous toutes ses formes et sur tous ses supports, et notamment la donne individuelle, est un lment et un aliment essentiel dans le dveloppement de la nouvelle conomie qui se dploie l'entre du 3e millnaire. Ainsi l'affirmation de rgles claires concernant les places respectives de la puissance publique et du march, le fonctionnement et la rgulation du march, la protection des liberts individuelles et les droits des individus (et ventuellement des personnes morales) sur les donnes qui les concernent personnellement est un enjeu de premier rang dans cette perspective. Il est clair galement que le droit devient, pour les Etats, une arme dans la comptition conomique au sein de la socit mondiale de l'information, dont l'essor technologique efface les frontires physiques et politiques.

22

L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

- Michel Louis LVY - Rdacteur en chef des Annales des Mines - Secrtariat d'Etat l'Industrie III- Le numro INSEE : de la mobilisation clandestine (1940) au projet Safari (1974)

Il existe en France un identifiant universel des individus, dont le nom le plus courant, sinon le nom officiel, est numro de Scurit sociale . Ce numro nest pas alatoire, comme en dautres pays, il a un sens, tant tabli partir des date et lieu de naissance de lindividu. Comme il est gr par lInstitut de statistique, on lappelle aussi numro INSEE des individus . Ce numro intervient dans des actes importants et rcurrents de la vie quotidienne : il est notamment port sur les feuilles de paye des salaris ; les assurs sociaux le portent sur chaque feuille de maladie envoye la caisse de Scurit sociale pour obtenir le remboursement des soins. Du coup il est connu et mmoris par la plupart dentre eux, et beaucoup en connaissent le lien avec leurs date et lieu de naissance. 1- De la mcanographie dans les administrations La cration de ce numro est lie des circonstances exceptionnelles et la personnalit de Ren Carmille (18861945). Ce Contrleur gnral des Armes (X 1906), officier du deuxime bureau et pionnier de lutilisation administrative des machines mcanographiques cartes perfores avait invent et propos, ds dcembre 1934, un numro matricule destin tre attribu aux garons ds leur dclaration ltat civil, pour organiser lappel sous les drapeaux des classes dges successives. Aprs divers ttonnements, le numro expriment avait 12 chiffres et occupait donc 12 des 80 colonnes des cartes perfores standard de lpoque : deux pour lanne de naissance, deux pour le mois de naissance, deux pour le dpartement de naissance (lutilisation de ce code pour limmatriculation des automobiles ne sera dcide quen 1950), trois pour la commune de naissance (aucun dpartement ne comporte plus de 1000 communes), enfin trois pour un numro dordre dans le mois de naissance (aucune commune nenregistre plus de 1000 naissances par mois). Dans la France de lavant-guerre, le Colonel de Gaulle (n en 1890) militait pour lutilisation intensive des chars dassaut ; lancien ministre Adolphe Landry (n en 1874) et son disciple le statisticien Alfred Sauvy (n en 1898) militaient pour une politique nataliste ; le Contrleur gnral Ren Carmille (n en 1886), lui, militait pour promouvoir lusage des machines mcanographiques dans lensemble de ladministration ; il fit plusieurs rapports, crivit un livre (De la mcanographie dans les Administrations , Sirey 1936) ; il proposait de mettre la disposition de ltat de puissants moyens mcanographiques des fins de gestion et dinformation, administrative, dmographique, statistique. Son systme reposait sur des fichiers gants, o chaque fiche, correspondant chacune une ou plusieurs cartes perfores, dcrit un individu, ou un logement, ou un btiment, ou un vhicule. La Statistique gnrale est laboutissement ultime et global des statistiques administratives particulires : la masse est constitue de tous ses individus. Ltat-major autorisa Carmille mener quelques expriences, former quelques ateliers. Il poursuivit par ailleurs sa carrire au Contrle o il traitait de questionsL'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 23

plutt austres, comme la rforme du plan comptable de lArme, en rapport avec la Cour des Comptes. Il reprsentait le ministre de la Guerre dans diverses Commissions de statistique et il avait eu loccasion de confronter ses vues avec celles dAlfred Sauvy, qui lui tait compltement oppos aux normes fichiers et privilgiait plutt les enqutes lgres, prfigurant les sondages, alors expriments aux tats-Unis. Carmille tait aussi professeur Sciences Po, qui sappelait lcole libre des Sciences politiques. On a de lui un ouvrage intitul Vues dconomie objective et une confrence de 1938 sur le Germanisme . Vint la drle de guerre, la dbcle et larmistice. Il y avait plus dun million de prisonniers. En juin 1940, Hitler laisse la France le droit dentretenir une arme de 100 000 hommes. Nombreux sont ceux qui pensent ncessaire de se mnager une possibilit de pouvoir un jour la remobiliser. Voici ce que disent de lpisode deux historiens de larme darmistice (8) : Selon les directives du gnral Weygand, on singnia ce que leffectif de 100 000 hommes de larme de larmistice soit constitu en quasi-totalit de troupes combattantes. On y parvint par la dmilitarisation massive des services qui se murent en organismes civils. Cest ainsi que lon vit apparatre des chanceliers dtat-major, des fonctionnaires de la Statistique, des contrleurs de lAdministration, etc. () Le colonel du Vigier9, chef du 3me bureau, tudia avec le contrleur gnral Carmille la possibilit de ddoubler les effectifs, le moment venu, par rappel des combattants dmobiliss. (gnral Jacques Allard, CR) Un des premiers soins des commissions allemandes darmistice avait t de supprimer le service du recrutement et les centres mobilisateurs et de disperser ou de dtruire leurs archives. Toute mobilisation devenait impossible. Pour parer cette lacune, ds aot 1940, le contrleur gnral Carmille proposa au gouvernement de crer un service charg de tenir jour une sorte de registre de la population, en utilisant des procds mcanographiques, beaucoup moins rpandus quaujourdhui. Ce fut le Service de la dmographie, qui prit par la suite le nom de service national des Statistiques. Il installa Lyon un tablissement central et entreprit de crer un fichier mcanographique militaire, o chaque dmobilis, ou affect spcial, avait sa fiche personnelle. Ce travail servit de base un plan de renforcement de larme de larmistice portant sur 50 000 adresses de mobilisables prvus pour complter les huit divisions existantes. Une arme de 2me chelon denviron 200 000 hommes, capable de former une quinzaine de divisions et dunits non endivisionnes, tait galement recense par les mmes moyens. Les tableaux deffectifs avaient t fournis par ltat-major. Le travail tait achev et le rappel prt fonctionner pour le printemps de 1942. Les fiches individuelles taient mme imprimes. La cration de ce recrutement dun nouveau genre et la fourniture de tableaux deffectifs illustrent parfaitement la mthode que les chefs de ltat major de lArme, le gnral Verneau et le gnral Frre(10), tendaient utiliser, dans le secret et avec prudence, pour reconstituer une force militaire. (tienne Anthrieu) Ren Carmille obtint des gnraux Colson et Huntziger (11) la cration (15 dcembre 1940) du Service de la Dmographie, rattach au Ministre des Finances (ce qui dcide du rattachement qui(8) dans le Journal de la France, publication par fascicules des ditions Tallandier, parue dans les annes 1970 (9) Le gnral Jean Touzet du Vigier (1888-1980), dfenseur avant De Gaulle de la motorisation de lArme, sera la tte de la 1re division blinde au dbarquement de Provence et restera adjoint du gnral de Lattre de Tassigny jusqu son retrait en 1947. (10) Le gnral Aubert Frre (1881-1944), commandant de Saint-Cyr de 1931 1935, chef de la VIIme Arme et ce titre patron du colonel puis gnral De Gaulle en mai 1940, prside le tribunal militaire de Clermont-Ferrand qui condamne celui-ci mort par contumace. Fondateur de lOrganisation de rsistance de lArme (O.R.A.) en dcembre 1942, il sera arrt en juin 1943 et dport au camp de Struthof (Bas-Rhin) o il mourra dpuisement. Le gnral Jean douard Verneau (1890-1944), polytechnicien, est colonel en 1940. Il est nomm chef de la dlgation des services de larmistice (DDSA) Alger, en aot 1940, puis chef dtat-major de larme darmistice en juin 1942. Il succde en juin 1943 au gnral Frre la tte de lO.R.A. Arrt en octobre 1943, il dsigne son successeur, le gnral Revers, puis est dport Buchenwald, o il mourra. 24 L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

est toujours celui de lInsee). Ce service est dot de machines mcanographiques et charg entre autres fonctions, de la Liquidation de la Guerre . Il rcuprait une partie du personnel des bureaux de recrutement et lessentiel de leurs archives quil continuait de mettre jour. Le gouvernement Ptain lui affecta des centaines d'officiers et sous-officiers dmobiliss. Latelier central tait situ Lyon, six directions rgionales en zone sud, une Paris, dautres Alger, Tunis, Rabat. Trois constructeurs se partageaient alors le march franais des machines statistiques : Bull, la Compagnie lectro-comptable (CEC), filiale dIBM, et Samas-Powers, dorigine anglaise. Ren Carmille favorisa Bull, la plus franaise des trois, et passa dimportants marchs avec elle. Ses relations avec la Compagnie lectro-comptable cessrent vite, parce que la plus importante filiale europenne dIBM tait la Dehomag (Deutsche Hollerith Maschinen, AG) la filiale allemande, que Carmille tait all visiter (espionner ?) avant-guerre et dont plusieurs cadres taient devenus membres de la Commission dapplication des accords darmistice. 2- La mobilisation clandestine Pour disposer dun fichier utilisable en cas de remobilisation, il fallait crer un fichier des prisonniers et des soldats dmobiliss, avec indication de leur qualification professionnelle, de leur domicile habituel et de leur situation prsente. Cela conduisit trois oprations de grande ampleur, dont le souvenir a t refoul dans le subconscient collectif : 1. Pour crer le fichier des prisonniers, il fallut entrer en ngociations avec la Reichswehr par lintermdiaire du Comit international de la Croix-Rouge Genve. Ce fut loccasion pour Carmille de dmontrer que lutilisation de son numro serait beaucoup moins encombrante en nombre de caractres et beaucoup plus sre quant lhomonymie que celle des nom et prnom et du numro matricule, de type diffrent selon les armes. 2. De mars aot 1941, Carmille fit procder dans une relative discrtion aux relevs des actes de naissance dtenus par les greffes des tribunaux, pour doter dun numro environ 55 millions de personnes nes en France. Pour simuler une opration finalit civile, on releva les naissances des deux sexes et on ajouta alors un treizime chiffre en premire colonne, 1 pour les hommes, 2 pour les femmes. Notre dfinitif numro de Scurit sociale tait n. En temps ordinaire, lopration serait videmment strictement impossible sans vote dune loi. Mais, comme on dit, ncessit fait loi . 3. En vue de mettre jour les adresses bouleverses par lexode et en vue de relever les professions, un recensement dit des activits professionnelles (A.P.) fut organis le 17 juillet 1941, dans la seule zone libre . De laveu mme de Carmille, cette opration na pas lieu en zone occupe pour ne pas risquer de mettre sous les yeux des Allemands des informations dintrt militaire. Il sagissait de commencer constituer un grand fichier de dossiers individuels, correspondant plusieurs cartes perfores identifies par le mme numro didentit et contenant des renseignements scolaires, familiaux et professionnels. Lanne 1941 aurait d tre normalement celle du recensement quinquennal de la population. Mais il ne sagissait pas cette fois dun recensement exhaustif, puisque devait tre tabli un bulletin pour chaque personne franaise ou trangre ne entre le 1er janvier 1876 et le 31 dcembre 1927 (13 64 ans). Le questionnaire, len tte de ltat Franais, Travail Famille Patrie, explique : Le Gouvernement fait appel la bonne volont du public pour rpondre avec sincrit, prcision et exactitude aux questions qui lui sont poses loccasion du recensement actuel. Les renseignements que le(11) Le gnral Charles Huntziger (1880-1941), commandant le 4me groupe darmes, est charg de la ngociation des armistices avec les Allemands puis les Italiens. Commandant larme darmistice, il devient ministre de la Guerre Vichy en septembre 1940, mais disparat dans un accident davion dans le Gard le 14 novembre 1941. L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 25

Gouvernement attend de ce recensement lui sont en effet indispensables la suite des perturbations apportes par ltat de guerre lassiette de la population pour rsoudre efficacement, et dans lintrt de tous, les problmes sociaux et conomiques les plus urgents : chmage, reclassement professionnel, retour des prisonniers, ravitaillement, etc . Sur la premire page, les questions 1 5 portent sur ltat civil, la question 6 est quelle est actuellement votre rsidence habituelle ? , la question 7, rserve aux rfugis, est quel tait votre domicile avant le 3 septembre 1939 ? , les questions 8 11 portent sur la nationalit, 12 et 13 sur la famille, 14 17 sur linstruction (15 : quelles langues trangres parlez-vous couramment ?). La deuxime page est entirement consacre, questions 18 29, la profession et aux qualifications. Il y a une question n 30, numro de la carte dalimentation, et une question 31 pour les indignes ressortissants de lEmpire : de quelle colonie, protectorat ou pays sous mandat tes-vous originaire ? . En page 4, il y a deux notes courtes sur les questions 9 (franais de naissance) et 11 (Franais de race juive) et une note longue sur les professions. Je ne connais pas de document valuant la qualit des rponses ni prsentant les rsultats statistiques de ce recensement. Sil y en a eu, ils sont rests usage interne. Je possde un tmoignage crit sur le recensement AP, datant de 1988 : En juillet 1941, jai d me plier ce recensement, tant n quatre mois avant la date limite du 31/12/27. A lpoque, cette opration tait souvent interprte comme une prparation des rquisitions de main duvre inspire par les Allemands 47 ans aprs, les mentions lpoque et souvent sont forcment floues. Mais il est vident que le public considra lOccupant comme inspirant, et le Service de Dmographie comme excutant, ce recensement. Nul n'a jamais tudi, ma connaissance, quel en fut le taux de rponse. Le service civil jusque-l charg des recensements de la population, la Statistique gnrale de la France (SGF), dirige par Henri Bunle, na pas manqu de protester contre lintrusion sur ses plates-bandes de ces militaires camoufls. Mais Carmille a le bras long : le Service de la Dmographie absorbe la SGF, le 11 octobre 1941 ; l'ensemble prend le nom de Service national des Statistiques (SNS). Certaines ambiguts demeurent, qui attnuent le mcontentement des absorbs : la direction du SNS est Lyon, et la SGF est Paris. Mais lheure nest gure aux tats dme. Six nouveaux ateliers sont crs en zone nord. Les futures Directions gnrale et rgionales de lINSEE se mettent ainsi en place. Nat alors entre les anciens de la SGF, y compris Alfred Sauvy, et les militaires de Carmille, une sourde et rancunire rivalit, qui nexclut pas au plan individuel lestime et ladmiration rciproques. Si la mobilisation clandestine est et reste lobjectif central de Carmille, le SNS est une construction dont lampleur dpasse largement ce que les services secrets font dhabitude pour une couverture . A se demander quel projet est la couverture de lautre ? Carmille applique dsormais son programme davant-guerre, si bien quen trois ans il dote la France dun service de statistiques son ide, grant des fichiers dindividus, dentreprises et dtablissements, pratiquant sondages et enqutes, recrutant lcole Polytechnique des cadres qui prtent serment de respecter un secret professionnel strict, disposant dune cole dapplication, qui deviendra lEnsae en 1962. Du coup, si les statisticiens de la SGF ont de bonnes raisons de considrer ce militaire avec mfiance, les militaires eux-mmes, tous courants confondus, estiment quil dborde largement les missions que larme lui confie. 3- Les perscutions raciales Par le recensement AP, le service de la Dmographie, et sa suite le SNS, devenaient aussi partie prenante de la politique de discrimination raciale : la question n 11 tait Etes-vous de race juive ? tandis que la note cite rappelait la dfinition retenue par la loi du 3 octobre 1940. Il est pourtant aujourdhui tabli que ni le recensement AP, ni le numro Carmille neut aucun rle26 L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

dans les arrestations, dportations et spoliations raciales ; aucune bavure na jamais t signale. La codification de la question n11 semble cependant avoir eu quelques utilisations administratives, par exemple en 1943 pour exclure - on peut aussi dire dispenser - des Chantiers de Jeunesse les personnes qui staient dclares juives. titre de comparaison, il faut savoir que dans le Reich nazi, le Service de Scurit (SD) rcupra les fiches du recensement de 1939 sur l'ascendance juive, pour complter ses propres fichiers. Face aux besoins statistiques de la politique antismite nazie, les statisticiens allemands avaient dabord tergivers, en cherchant composer les distinctions prtendument raciales des nazis avec les distinctions antrieures, fondes sur la langue maternelle et la nationalit, en se retranchant derrire les insuffisances de la lgislation (12). Le directeur de la Statistique du Reich, Friedrich Burgdrfer, justifiait ainsi en 1938 le non-comptage des Juifs au recensement de 1933 : " Ce n'tait pas la faute de la statistique et des statisticiens ; cela tenait au fait que, dans la politique, la lgislation, l'administration, les conditions exiges pour un relev global de la judit n'taient pas donnes ". Cela ne lempcha pas, par la suite, de se conformer aux dfinitions des " lois de Nuremberg " de 1935 et de se lancer dans une estimation du nombre de Juifs et demi-juifs . La servilit culmina chez le sinistre Richard Korherr, futur auteur de la statistique de la solution finale reprise dans le Brviaire de la Haine de Lon Poliakov (1951), qui en vient critiquer les recensements fonds sur l'auto-dclaration et soumis au secret professionnel et leur prfrer les documents administratifs contrls par la police. Carmille, lui, est tout la fois imprudent, habile et finalement hroque. Il lui a fallu dpenser beaucoup dnergie pour que les concessions faites pour organiser le recensement AP ne servent pas la discrimination raciale (personne n'envisageait alors l'ampleur qu'allait prendre la perscution raciale, jusqu' la "solution finale"). Une alerte tait survenue quand la SGF eut la navet de proposer ses services : Henri Bunle, par deux lettres de mars et avril 1941, demanda que la SGF soit charge de la centralisation des renseignements sur les Juifs rassembls par les Prfets (13). La premire lettre, au ministre de lIntrieur, veut simplement rduire les estimations exagres du nombre de Juifs en France qui avaient t publies par la presse. Mais la seconde, adresse Xavier Vallat, frachement nomm Commissaire gnral aux Questions Juives, ajoute quen cas dacceptation, les rsultats de lenqute seraient tenus rigoureusement secrets par la SGF et uniquement communiqus au CGQJ , ce qui serait aujourdhui rigoureusement contraire tous les codes de dontologie des statisticiens. Ces offres de service furent, heureusement pour lhonneur de ceux-ci, dclines par les services de Darlan et les comptages de Juifs strictement rservs aux Services de police et au CGQJ. Mais laffaire rebondit quand celui-ci, prenant au mot les offres dassistance statistique que Carmille envoyait toutes les administrations socio-conomiques, demanda au SNS dassurer lexploitation mcanographique du recensement des Juifs de juin 1941, prescrit par le second statut des Juifs. Il est essentiel de pas confondre le recensement AP de juillet 1941, qui sapplique la population entire de zone sud ge de 13 65 ans, et la criminelle opration policire anti-juive de juin 1941, connue par voie daffiches sous le nom recensement des Juifs . Cette opration policire conduisit des documents que les services du SNS de Clermont-Ferrand et de Limoges taient invits identifier , cest--dire complter par le numro didentification, en vue dune exploitation mcanographique. La mthode de Carmille consista ne jamais rien refuser explicitement mais exiger la matrise de lopration au nom de la technicit ncessaire. Il envoya son adjoint Saint-Salvy ngocier Paris, il accumula les difficults et retarda le plus possible(12) Morgane Labb dans " Compter l'autre ", Histoire et mesure, 1998,CNRS, volume XIII, n1/2 (13) Henri Bunle, n en 1884, est dcd en 1986. Interrog sur ces lettres, il les a justifies par la ncessit dutiliser le matriel mcanographique de la SGF, prive du recensement de la population prvu en 1941. L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 27

lexploitation par des consignes orales aboutissant une sorte de grve du zle dautant plus facile appliquer que beaucoup de personnes concernes taient nes l'tranger ou en Alsace annexe et n'avaient donc pas eu de numro d'identit attribu. Il fit si bien que le chiffrement demand par Xavier Vallat naboutit, aprs trois ans datermoiements, qu un tat numrique des Juifs franais et trangers recenss en juin 1941 , en exemplaire unique, qui ntait pas termin en fvrier 1944, lors de larrestation de Carmille. Ce document fut retrouv lINSEE par M. Marcel Croze et je lai lgu en 1980 au Centre de documentation juive contemporaine (CDJC), rue Geoffroy lAsnier, o il peut tre consult. Il sagit de tableaux anonymes, par sexe et par dpartement, du nombre de Juifs recenss, classs par nationalit et activit professionnelle, et o il y a beaucoup de 0 et de 1 : combien de Juifs roumains du sexe masculin, exeraient en juin 1941 la profession de serrurier dans les Pyrnes-Orientales ? Hlas les services de police organisrent rafles et dportations partir de leurs propres fichiers, adapts de celui mis au point avant-guerre la Prfecture de Police par Andr Tulard pour surveiller les menes communistes ; de mme, le CGQJ procda aux spoliations que vient de reconstituer la commission Mattoli en se passant de mcanisation : du moins les statisticiens du SNS, ni directement par leurs travaux, ni indirectement par lusage du numro didentit, neurent de part dans les menes criminelles du prtendu gouvernement de Vichy. 4- La dclaration de domicile Il est devenu courant dvoquer, propos de Ren Carmille et dautres hauts responsables en activit sous Vichy, le colonel anglais du roman de Pierre Boulle, le Pont de la Rivire Kwa, incarn lcran par Alec Guiness (dcd en aot 2000). Dans ce film magnifique, que la tlvision projette de loin en loin, le colonel Nicholson et ses hommes sont faits prisonniers, en 1943, par l'arme japonaise et conduits dans un camp perdu dans la jungle birmane. Le colonel Saito, commandant du camp, veut faire construire par les prisonniers un pont ferroviaire sur la rivire Kwa. Les deux hommes ont des conceptions fort proches de lhonneur militaire et des vertus rdemptrices du travail et de la matrise technique. Mais ils saffrontent sur la notion de trahison, qui dpend du sens dans lequel le premier train empruntera le pont, selon quil transporte des renforts anglais ou japonais. De la mme faon, Ren Carmille avait certainement de lestime pour les capacits techniques des spcialistes allemands en machines mcanographiques. Ici lenjeu va bientt tre de savoir si les cartes perfores vont mobiliser de jeunes Franais pour les envoyer en Allemagne ou pour les mettre au service des armes, franaises et allies, qui allaient dbarquer, nul ne savait o. Comme Nicholson, Ren Carmille va laisser la vie dans cet affrontement. Ceci dit, comparaison nest pas raison et analogie nest pas similitude. Dans les lgendes, cest le diable qui construit les ponts et exige une me en paiement, tandis que les fichiers de personnes relveraient plutt du Tout-Puissant, Celui Qui, au Jardin dEden, appelle lhomme et lui dit : O es-tu ? (Gense, 2,9). La donne critique des fichiers individuels est ladresse, alors que le numro d'identit est fond sur la commune de naissance. Or les autorits dOccupation pressent Vichy de rendre la dclaration de changement dadresse obligatoire. Carmille voit que l'intrusion de proccupations policires, et qui plus est, ennemies, risque de ruiner la crdibilit du SNS. Pour mettre jour ladresse, il se contente de divers moyens administratifs, dont le plus connu est le renouvellement des cartes de tabac (14). La(14) Dans ses mmoires multigraphies De Vichy Buchenwald (1992), le Contrleur gnral Louis Forestier (X 1923) parle ainsi de Ren Carmille, qu'il rencontre en janvier 1943 et auquel il devait succder aprs la Libration : "C'tait 28 L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000

loi instituant l'obligation de dclaration de changement de domicile (15) est date du 30 mai 1941, mais n'est publie que le 28 fvrier 1942. Or par lettre du 25 janvier 1942, Carmille informe le ministre des Finances que les Allemands exigent la publication de cette loi avant le 1er mars 1942 et menacent de linclure dans les Ordonnances des autorits doccupation avec des conditions contraignantes. Le texte publi ne prvoit de sanctions que pour les trangers qui y contreviendraient, sous forme d'amendes (16). Cette affaire, dont la disparition prmature de Carmille na pas permis de bien comprendre les tenants et les aboutissants, a gravement nui la rputation du SNS, celle de Carmille. Les tmoignages tardifs des survivants nont rien arrang. Dans une communication faite Toulouse en 1963, publie en 1966, lInspecteur gnral de lInsee G. Marie, qui ntait pas des intimes de Carmille, crit : Pour permettre la tenue jour certaine des dossiers individuels constitus, la dclaration de changement de domicile qui ntait jusqualors impose quaux mobilisables fut tendue tous les Franais sans distinction de sexe ni dge. La population crut que cette mesure avait t impose par loccupant, alors que son objet premier tait de continuer tenir jour le fichier militaire noy dans la masse. Mais, tandis que les autres lments du dossier taient gnralement recueillis linsu du titulaire, cette foisci il y avait une obligation qui tombait sur chaque citoyen, et la mesure fut dautant plus impopulaire. On jugea cette mesure attentatoire la libert et, la Libration, elle fut supprime. [] [Le recensement AP] fut excut le 17 juillet 1941, et comme tout tait prt pour son exploitation, elle commena sans retard et elle tait compltement termine en janvier 1942. La division du travail dans le service tait organise de telle manire que la seule partie vraiment rvlatrice, si elle et t dcouverte par lennemi, la synthse militaire finale, tait excute Lyon dans un bureau spcial et n'tait connue, dans son dtail, que d'un trs petit nombre de personnes absolument sres : deux administrateurs du service, anciens officiers, et un mnage de secrtaires dactylographes. Les fiches [] constituaient un trs faible volume. Il serait du plus grand intrt de poursuivre des recherches sur l'application de cette "loi" et, plus gnralement, sur la guerre des faux papiers qui allait tre si dterminante dans lactivit de la Rsistance et qui allait engendrer un tabou : en France, ltat ne peut exiger la dclaration du changement de domicile, au grand dommage, par exemple, des tudes sur la mobilit des mnages. Le 1er mai 1942, le gauleiter Fritz Sauckel presse Vichy de mobiliser 250 000 ouvriers pour renforcer leffort de guerre allemand. Laval le rencontre le 16 juin et espre sen tirer avec des volontaires : le 22, il institue la Relve , qui prvoit le retour dun prisonnier contre le dpart de trois travailleurs volontaires pour lAllemagne. Cest ici que se place le discours radiodiffus o il reconnat quil souhaite la victoire de lAllemagne . Dans ses mmoires, Alfred Sauvy voque un appel tlphonique du ministre Bichelonne pour savoir ce quon peut attendre, en cas de mobilisation , des cartes perfores du service statistique. Il renvoie lappel Carmille, Lyon.

un prcurseur de la mcanographie qui dirigeait Lyon un service de statistiques. C'est lui qui avait cr le "numro de franais" qui existe toujours, sous prtexte de la rpartition du tabac, en ralit un fichier de recrutement ". (15) Il y a en cette priode trouble une distinction entre le domicile, habituel, et la rsidence, contingente. (16) Robert Carmille : Les services statistiques franais pendant l'Occupation, brochure ronote, aot 2000, p.55-56. L'utilisation des sources administratives en dmographie, sociologie et statistique sociale 20 septembre 2000 29

5- La mobilisation en Algrie Une complication avait surgi en Algrie, o coexistaient des citoyens franais, des trangers, des Arabes, sujets musulmans et des Juifs. Les recensements de population, y compris celui de 1936, dcomptaient sparment chrtiens, juifs et musulmans. Le 7 octobre 1940, dans la foule du statut des Juifs , Vichy avait de plus abrog le dcret Crmieux de 1870 qui avait dclar citoyens franais les juifs indignes des dpartements de lAlgrie . Les juifs indignes redevenaient des sujets , comme les Arabes ; entre autres mesures discriminatoires, leurs enfants sont exclus des coles publiques. Or lAlgrie tait le grand espoir de ceux qui attendaient le moment de reprendre la lutte contre lenvahisseur. Le Gnral Weygand, Dlgu Gnral en Afrique franaise (17) y reconstitue, sous couvert de Lgion des Combattants, une arme franaise plus nombreuse que celle de larmistice. Mais la tragdie de Mers-El-Kbir (3-6 juillet 1940) exacerbe les sentiments anti-gaullistes et anti-anglais. Ren Carmille avait fait passer Alger, fin juin 1940, le matriel du bureau de recrutement de Rouen, y compris un prototype de tabulatrice transport en avion. En mai 1941, il rencontre Weygand Alger On peut supposer quil lui expose les dispositions prvues en cas de mobilisation et lintrt des quipements mcanographiques. Or un souci de ltat-major tait de mlanger le moins possible soldats musulmans et juifs, do la ncessit de les distinguer lors du recrutement. Une note de service du 15 avril 1941 avait prvu quen ce qui concerne la composition du numro didentification, des rgles particulires doivent tre tablies pour les personnes nes en Algrie[] Pour ces personnes, le chiffre indiquant le sexe sera 1 ou 2 pour les F