28
Distribution limitée SHS/YES/IBC-23/16/3 Paris, le 7 juillet 2016 Original anglais PROJET PRÉLIMINAIRE DE RAPPORT DU CIB SUR « BIG DATA » ET SANTÉ Dans le cadre de son programme de travail pour 2016-2017, le Comité international de bioéthique de l'UNESCO (CIB) a décidé de traiter du sujet « Big Data » et santé, en se concentrant sans s’y restreindre sur les problématiques liées à l’autonomie, au consentement, à la protection des données et à la gouvernance etc. Lors de la 22 ème session (ordinaire) du CIB en septembre 2015, le Comité a constitué un Groupe de travail qu'il a chargé d'élaborer une réflexion initiale sur ce sujet. Le Groupe de travail du CIB a entamé, entre octobre 2015 et mars 2016, au moyen d'un échange de courriers électroniques, la préparation d'un texte relatif à cette réflexion. Il s'est également réuni à Cologne en mai 2016 afin de peaufiner la structure et le contenu de ce texte. Le présent document, basé sur le travail accompli à ce jour, contient le projet préliminaire de rapport préparé par le Groupe de travail du CIB. En l'état actuel, ce projet préliminaire de rapport ne représente pas nécessairement l'opinion finale du CIB, et il fera l'objet de plus amples discussions au sein du Comité en 2016 et 2017. En outre, ce document ne prétend pas être exhaustif et ne représente pas nécessairement les vues des États membres de l'UNESCO.

Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

  • Upload
    doandan

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

Distribution limitée

SHS/YES/IBC-23/16/3 Paris, le 7 juillet 2016

Original anglais

PROJET PRÉLIMINAIRE DE RAPPORT DU CIB SUR « BIG DATA » ET SANTÉ

Dans le cadre de son programme de travail pour 2016-2017, le Comité international de bioéthique de l'UNESCO (CIB) a décidé de traiter du sujet « Big Data » et santé, en se concentrant sans s’y restreindre sur les problématiques liées à l’autonomie, au consentement, à la protection des données et à la gouvernance etc.

Lors de la 22ème session (ordinaire) du CIB en septembre 2015, le Comité a constitué un Groupe de travail qu'il a chargé d'élaborer une réflexion initiale sur ce sujet. Le Groupe de travail du CIB a entamé, entre octobre 2015 et mars 2016, au moyen d'un échange de courriers électroniques, la préparation d'un texte relatif à cette réflexion. Il s'est également réuni à Cologne en mai 2016 afin de peaufiner la structure et le contenu de ce texte. Le présent document, basé sur le travail accompli à ce jour, contient le projet préliminaire de rapport préparé par le Groupe de travail du CIB.

En l'état actuel, ce projet préliminaire de rapport ne représente pas nécessairement l'opinion finale du CIB, et il fera l'objet de plus amples discussions au sein du Comité en 2016 et 2017. En outre, ce document ne prétend pas être exhaustif et ne représente pas nécessairement les vues des États membres de l'UNESCO.

Page 2: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 2 -

PROJET PRÉLIMINAIRE DE RAPPORT DU CIB

SUR « BIG DATA » ET SANTÉ

I. CHAMP DU DOCUMENT ET DÉFINITIONS

II. PROMESSES

III. DES FRONTIERES QUI S’EFFACENT

IV. CADRE JURIDIQUE

V. DEFIS ETHIQUES

V.1. Autonomie

V.2. Vie privée et confidentialité

V.3. Propriété

V.4. Justice

V.5. Défis spécifiques de la recherche « Big Data » en santé

VI. GOUVERNANCE

VII. RECOMMANDATIONS

BIBLIOGRAPHIE

Page 3: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 3 -

PROJET PRÉLIMINAIRE DE RAPPORT DU CIB SUR « BIG DATA » ET SANTÉ

I. CHAMP DU DOCUMENT ET DÉFINITIONS

1. La numérisation de toutes sortes de données mène à un phénomène en évolution exponentielle appelé « Big Data ». Les technologies impliquées qui utilisent ces données pour une grande variété de buts touchent et transforment chaque domaine de notre vie partout dans le monde. Dans ce rapport le CIB aborde des questions pertinentes concernant le domaine de la santé et examine ce qui doit être pris en compte pour que, selon l'Article 3 de la Déclaration Universelle sur la Bioéthique et des Droits de l'homme la dignité humaine, les droits fondamentaux et des libertés fondamentales soient entièrement respectés.

2. Le « Big Data » est caractérisé par ce que l’on appelle les 5 Vs:

a. Le Volume se réfère à l’énorme quantité de données digitalisées. Celles-ci croissent à un rythme exponentiel. Tandis que les trois quarts de données ont été analogiques en 2000, aujourd'hui plus de 99 % de toutes les données sont de nature numérique. Pour l’année 2015 il y a un montant évalué de 8.- 6 zetabytes (1021) et pour 2020 il s’agirait de 44 zetabytes.

b. La Variété fait allusion sur au fait qu'il y ait des formes différentes de données provenant de diverses sources. Pour les services médicaux et la recherche, plusieurs sources de données sont pertinentes : des données médicales de soin individuel au patient, des données de santé publique, des données de différentes assurances santé, des données de recherche rassemblées par les chercheurs, les entreprises ou les individus eux-mêmes, des données sur le style de vie comme par exemple provenant des applications de santé, des données de réseaux sociaux et des données du commerce. Ces données peuvent être classifiées de différentes façons et selon des critères différents : il y a par exemple des données personnelles, des données rendues anonymes, des métadonnées, des données primaires et secondaires.

c. La Vitesse désigne la rapidité, qui peut être utilisée pour rassembler et traiter des données. Le dépistage en temps réel et des solutions de Cloud fournissent un traitement compréhensif en quelques secondes et produisent des recommandations comme par exemple pour le comportement, les médicaments ou la nutrition.

d. La Véracité se réfère à la qualité de données et si elles montrent vraiment ce qu’elles sont supposées montrer, en ce qui concerne le contenu et la précision. Le contexte de données joue un rôle majeur ici.

e. La Valeur, finalement, attire l'attention sur la signification de données pour une question spécifique comme par exemple en ce qui concerne une certaine maladie. Il est important de prendre en compte le contexte de la donnée en question.

3. La santé est un concept normatif difficile à définir. Les définitions varient selon le but des normes liées. La large définition fournie par l’OMS, que la santé représente l'état de bien-être physique, mental et social complet et non seulement l'absence de maladie ou l'infirmité, embrasse la vie entière d'un individu à tous égards. C’est de cette définition qui émane l’idée régulatrice principale à l’œuvre dans la promotion de la santé mondiale. Dans des systèmes nationaux de santé une approche plus étroite est privilégiée, spécifiant et limitant les responsabilités des corps médicaux et des institutions. Les nouveaux mots comme e-santé (la santé électronique) et m-santé (la santé mobile) se réfèrent aux moyens de services de santé en termes de dispositifs électroniques, de la communication mobile - et des technologies de réseau.

Page 4: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 4 -

4. Le nombre d’apps est en croissance permanente (selon des évaluations il y en a déjà plus de 180.000). Celles-ci abordent des questions diverses de santé passant de l’aptitude physique et de la nutrition aux diagnostiques de mélanome et au soutien de la gestion de maladies chroniques. Il est à peine possible de distinguer les apps de santé médicale des d'apps de nature non-médicale et il est encore plus difficile de contrôler et garantir la qualité de ces apps. En abordant le sujet « Big Data » et santé dans ce rapport, il s’agit d’aller plus loin que les services de santé traditionnels et la recherche médicale.

II. PROMESSES

5. Au cours des 10-15 dernières années, la médecine a subi une révolution qui transformera fondamentalement la pratique de la recherche médicale et des services de santé dans le futur. Des développements technologiques dans le domaine de la génomique et d'autres techniques « omiques » à haut débit (les épigéomiques, transcriptomiques, protéomiques, métabolomiques, microbiomiques, etc) ont rendu l'analyse moléculaire d’échantillons humains par ordre de grandeur moins chers et plus efficaces. La détermination du séquençage du génome de patients individuels est en train de devenir une réalité.

6. La caractérisation moléculaire de maladies a montré de façon inattendue la haute hétérogénéité de maladies (non contagieuses) communes et des maladies rares aussi bien que des cancers. Ces données moléculaires peuvent être complétées avec des données d'image numérique passant du niveau microscopique à l'imagerie de la totalité du corps et avec des informations environnementales et de style de vie rassemblées auprès d'un grand nombre d'individus (comme par exemple de la population ou des cohortes de patients), de sondages ou de registres différents, de bases de données et d’infrastructures de recherche. Toutes ces données combinées avec des informations issues des rapports de santé électroniques (RSE) pourront dans l'avenir, tel est l'espoir, fournir une approche fondamentalement différente et plus personnalisée au diagnostic et au traitement des patients, c'est-à-dire offrir le bon traitement à la bonne personne, au bon moment et au dosage adéquat. Cette vision du « Big Data » dans la recherche et les soins médicaux est un concept, exhaustif et basé sur des preuves, de médecine personnalisée, de plus en plus appelée médicine de précision, qui s’adapte au patient individuel dans presque tous les respects.

7. Le « Big Data » médical s’entremêle avec le « Big Data » lié à l’usage d’Internet, des réseaux sociaux, des appareils intelligents, des cartes de crédit, des cartes de fidélité etc. Ce type de « Big Data » en forte croissance est collecté, analysé et utilisé pour definir les profils des individus, souvent sans que ces derniers ne soient au courant. L’internet des Objets- les appareils connectés à internet- permet à ces appareils de collecter et d’échanger des données les uns avec les autres ainsi qu’avec des utilisateurs extérieurs, rendant ainsi l’analyse de données complexes et apparemment sans rapport, possible. Bien que le « Big Data » collecté auprès de sources non-médicales et ne provenant pas d’organismes de recherche puisse être peu fiable, il y a un véritable potentiel d’utilisation de ce « Big Data » pour des fins de recherches médicales, avec quelques restrictions, ou de profilage.

8. De plus il est fort probable que la convergence entre les technologies de surveillance personnelle et les avancées des technologies de communication sans fil (Internet du Corps) continuera de s’accentuer et sera l’une des forces motrices dans le développement d’un « Big Data » plus fiable présentant un intérêt pour la santé. Dans un avenir proche, il est probable que les soins de santé évolueront rapidement vers la surveillance à distance de plusieurs paramètres et activités de santé, comprenant également des recommandations pour l’adoption de modes de vie sains.

9. Il existe une autre raison d’espérer liée à la collecte, l’évaluation et l’utilisation des données à distance. Cela peut contribuer à améliorer les soins de santé télémédicaux pour les populations vivant dans des régions où l’hôpital ou le docteur le plus proche se trouvent très loin ou dans des pays avec des systèmes de soins santé peu développés. L’accès à des

Page 5: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 5 -

soins de santé de qualité pourrait être encouragé par les moyens technologiques contribuant ainsi à la santé mondiale.

10. Un scenario futur associé est que la connaissance approfondie du patrimoine génétique des individus et des profils « omiques » couplée à l’accès à d’autres informations médicalement pertinentes comme les données sociodémographiques, les caractéristiques comportementales et psychologiques permettront progressivement de déterminer les prédispositions aux maladies et de délivrer des conseils ciblés, en temps opportun de prévention, ouvrant ainsi la voie à une substitution du traitement par la prévention.

11. Dans ce contexte, au moins quatre changements de paradigmes dans les soins de santé se produiront : un déplacement de l’attention et de l’orientation de la maladie sur la santé, du traitement à la prévention, de la santé aux conseils de vie, et du patient au client. Tous ces changements reposent sur l’idée que la connaissance des prédispositions et des facteurs qui influencent la santé pourrait conduire à un changement des modes de vie, ce qui rendrait les traitements moins nécessaires. Les personnes consultant les médecins ne rechercheront plus un traitement, mais voudront savoir comment rester en bonne santé, et deviendront ainsi davantage un client qu’un patient.

12. Cela suppose bien sûr des actions appropriées de la part de tous les acteurs engagés dans ce processus. Les membres de professions médicales devront comprendre et faire bon usage des données. Les patients-clients auront besoin à la fois de comprendre les conseils et être à la fois prêts et capables de les suivre. Cependant, il y a au moins une faiblesse de nature humaine dans ce système, qui pourrait se résorber dans le futur quand les clients seront mieux préparés grâce à leur éducation à faire face à ces nouvelles données de santé et à ajuster leurs comportements de manière appropriée. Cette faiblesse réside dans le fait que même si les individus comprennent les informations, cela ne signifie pas nécessairement qu’ils agiront en conséquence. En fait, dans la plupart des cas, aucune action n’est entreprise.

13. Pour les entreprises pharmaceutiques, il y a l’espoir que le « Big Data » facilite la compréhension moléculaire des maladies, de sorte que les études cliniques puissent être précisément stratifiées, permettant ainsi de mettre en place des études avec un plus petit nombre de participants, des coûts réduits, et une durée de brevet prolongée. Les régulateurs pourraient peut-être mieux comprendre et contrôler la conception des études et bénéficier de l’amélioration de la pharmacovigilance qui en résulterait. Enfin, les patients pourraient potentiellement tirer profit de leur meilleure compréhension de leur statut médical et des comportements permettant d’améliorer la santé ; ils auront la possibilité d’exercer un plus grand contrôle sur leurs données (par exemple en ayant leurs RSE sur leurs téléphones portables) et vivront vraisemblablement mieux et plus longtemps.

14. Il est très difficile de prévoir à quelle vitesse et dans quelle mesure ces changements seront mis en œuvre. Certains sont déjà disponibles - comme le partage des données entre plusieurs pays afin d’analyser les mutations de l’ADN ou d’obtenir des données sur des maladies rares. Certaines manipulations, comme le séquençage de l’ADN, deviennent moins chères, mais les soins de santé demeurent coûteux. De plus, outre le rapide développement de la médecine de précision dans les pays riches, perdurent les problèmes des maladies affectant les populations vivant dans des pays aux dépenses de santé plus faibles. Afin de mettre en œuvre une médecine de précision fondée sur le « Big Data », la profession médicale aura besoin de solutions complètement nouvelles dans la manipulation et représentation des données afin de traduire le « Big Data » en des informations signifiantes dans l’environnement médical actuel. Seulement à ce moment-là, le « Big Data » pourrait être utilisé pour améliorer les interventions médicales et les services de santé, ainsi que les prédictions et les stratégies de prévention comme les politiques de santé publique en général.

III. DES FRONTIERES QUI S’EFFACENT

15. En gardant à l'esprit la large définition de la santé de l'OMS et en reconnaissant qu’en majeure partie les conditions de santé ne dépend pas des soins de santé, mais de l'éducation,

Page 6: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 6 -

le style de vie, et l’environnement, le « Big Data » ouvre la voie à une vue holistique sur la santé en rassemblant différents types de données de tous les domaines de la vie. Ainsi, la limite entre les questions de santé et les questions de style de vie se brouille.

16. Ceci est accompagné par les limites mal définies entre le secteur des soins de santé et d'autres secteurs de la société. Les sources de données sur la santé peuvent être traditionnelles, tels que les dossiers médicaux, les résultats de laboratoire, les données de recensement, les données de surveillance épidémiologique, etc., mais aussi ce qui n’est pas traditionnellement considéré comme source de données de santé, tels que les réseaux sociaux ou des bases de données de consommation exploités par différents fournisseurs, ou sources de données publiques ne provenant pas du domaine de la santé tels que les agences des impôts, les ministères de l'éducation ou des services sociaux ministères, pour en nommer quelques-uns. Les fournisseurs de réseaux sociaux et moteurs de recherche demandent et recueillent également beaucoup d'informations sur leurs utilisateurs, qui sont ensuite traitées et vendues à des sociétés différentes qui à leur tour utilisent des « stratégies de marketing personnalisées », offrant aux utilisateurs des réseaux sociaux et moteur de recherches différentes promotions en fonction de leurs historiques de recherche ou participation à des groupes en ligne, par exemple. Cela inclut également les questions de santé, de sorte que la recherche de données privées sur une maladie personnelle ou familiale devient une information publique dans les mains des entreprises.

17. En outre, la démarcation entre les soins de santé et la recherche médicale s'estompe. Il peut être très utile et même salvateur d'avoir des données réelles de la vie, sur le cours des maladies et l'efficacité des thérapies. Les essais cliniques se produisent dans certaines circonstances, qui diffèrent des conditions de la vie réelle et qui ne sont exécutés que pendant une courte période de temps. Le « Big Data » permet la collecte et l'évaluation des données pour un grand nombre de patients sur une longue durée de temps. Cependant, il y a des défis majeurs à la protection et à la qualité des données. Mais, en principe, de nouveaux aperçus deviennent possibles, de sorte que les données de soins de santé et par exemple à partir des dossiers numériques des patients, peuvent aussi bien être immédiatement utilisées à des fins de recherche.

18. De plus, la limite entre les différentes disciplines professionnelles se troublera. Au moins certains types de maladies ne seront plus compris en fonction de l'organe affecté, mais plutôt selon le modèle sous-jacent des mutations et des variantes dans les « omiques », conduisant à des thérapies personnalisées. Une approche pluridisciplinaire pour les soins de santé, comme il est déjà mis en œuvre en oncologie dans certains pays, sera responsable pour un patient et de nouvelles disciplines professionnelles vont probablement évoluer.

19. D'autres acteurs non traditionnels, tels que les entreprises, entreront dans la phase de soins de santé et se rapprocheront du patient. La frontière entre les soins hospitaliers et ambulatoires s'effritera de plus en plus et le smartphone se révélera probablement comme un dispositif central pour la coordination des soins de santé des usagers. Ceci sera déclenché par le passage du traitement à la prévention et à la promotion de la santé, de sorte que les secteurs des soins de santé traditionnels s’effaceront aussi de plus en plus.

IV. CADRE JURIDIQUE

20. Si l’on ne trouve pas de réglementation propre au phénomène du « Big Data » dans les cadres juridiques nationaux et internationaux, il existe cependant, dans de nombreuses juridictions, une réglementation complète de la protection des données. Beaucoup de leurs règles peuvent s’appliquer au « Big Data », bien qu’il s’agisse d’un phénomène nouveau en termes de quantité, d’analyse et d’accessibilité. Les dispositions juridiques qui régissent la protection des données contiennent les grands principes et règles permettant d’appréhender le phénomène du « Big Data », si bien qu’on peut moins parler d’une absence de réglementation que d’un manque de dispositions spécifiques voire de nouveaux principes pour réguler le « Big Data » et leurs particularités d’un genre nouveau.

Page 7: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 7 -

21. Quand on compare les réglementations nationales, il convient de bien distinguer l’Europe des États-Unis. L’approche européenne considère la vie privée comme un droit humain fondamental ; elle est verticale et énonce des règles générales qui limitent l’usage des données ou nécessitent que cet usage soit soumis à un consentement explicite. À l’inverse, aux États-Unis l’approche est sectorielle et consiste à réglementer les risques spécifiques d’atteinte à la vie privée dans des contextes bien particuliers, tels que la santé et le crédit. L’utilisation des données y est soumise à moins de règles générales, ce qui permet à l’industrie d’être plus innovante dans ses produits et services, tout en laissant parfois entre les différents secteurs des usages potentiels non réglementés de l’information. (« Big Data »: Seizing opportunities preserving values, Executive Office of the President, The White House, États-Unis, 2014.)

22. Dans le cadre juridique international, la Déclaration universelle des droits de l'homme adoptée en 1948 par l’Assemblée générale des Nations Unies traite de la vie privée dans son article 12 : « Nul ne sera l'objet d'immixtions arbitraires dans sa vie privée, sa famille, son domicile ou sa correspondance, ni d'atteintes à son honneur et à sa réputation. Toute personne a droit à la protection de la loi contre de telles immixtions ou de telles atteintes. » Dans le même ordre d’idées, la Convention européenne des droits de l’homme instaure dans son article 8 un droit au respect de la vie privée et familiale et proclame : « 1. Toute personne a droit au respect de sa vie privée et familiale, de son domicile et de sa correspondance » et ajoute : « 2. Il ne peut y avoir ingérence d’une autorité publique dans l’exercice de ce droit que pour autant que cette ingérence est prévue par la loi et qu’elle constitue une mesure qui, dans une société démocratique, est nécessaire à la sécurité nationale, à la sûreté publique, au bien-être économique du pays, à la défense de l’ordre et à la prévention des infractions pénales, à la protection de la santé ou de la morale, ou à la protection des droits et libertés d’autrui. »

23. Le Conseil de l’Europe a également approuvée en 1981 la Convention pour la protection des personnes à l’égard du traitement automatisé des données à caractère personnel (n° 108, 28 janvier 1981), qui a pour objet de protéger l’individu contre les abus qui pourraient naître de la collecte et du traitement des données personnelles et vise à réguler le flux transfrontalier desdites données. Ultérieurement, le Conseil de l’Europe a approuvé un Protocole additionnel à la Convention pour la protection des personnes à l’égard du traitement automatisé des données à caractère personnel (n° 181), concernant les autorités de contrôle et les flux transfrontières de données pour renforcer la protection des données personnelles et de la vie privée par une amélioration de la Convention initiale de 1981 dans deux domaines. Premièrement, la création d’autorités nationales de contrôle chargées d’assurer la conformité avec les lois ou les réglementations adoptées dans le cadre de la Convention en ce qui concerne la protection des données personnelles et leurs flux transfrontaliers. Deuxièmement, une amélioration des flux transfrontaliers de données vers des pays tiers. Les données ne peuvent être transférées que si l’État ou l’organisme international de destination peut assurer un niveau de protection adéquat.

24. Il existe également une Recommandation pertinente du Comité des ministres aux États membres dans le domaine de la biomédecine et des soins de santé : la Recommandation n°R (97) 5 relative à la protection des données médicales (qui remplace la Recommandation n°R (81) 1 relative à la réglementation applicable aux banques de données médicales automatisées). Cette Recommandation protège toutes les informations concernant l’état médical d’une personne, par exemple aux fins d’assurance, notamment des données sur son comportement, sa conduite sexuelle, son style de vie ou encore sa consommation de drogue, d’alcool ou de tabac. Elle prend acte de la place grandissante prise par le traitement automatisé des données médicales par des systèmes d’information, et pas seulement pour les besoins des soins et de la recherche médicale ou de la gestion hospitalière. Elle affirme également que les progrès en médecine dépendent dans une large mesure de la disponibilité de données médicales sur les individus.

Page 8: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 8 -

25. L’OCDE a mis au point des Lignes directrices de l'OCDE sur la protection de la vie privée et les flux transfrontières de données de caractère personnel (1980, révisées 2013). L’Organisation dans un récent rapport a mis en lumière la nécessité d’élaborer des cadres juridiques adaptés pour le partage des informations (Améliorer l'efficacité du secteur de la santé : Le rôle des technologies de l'information et des communications, 2010). Ce rapport souligne la nécessité d’un nouveau cadre juridique permettant le partage d’informations relatives à la santé entre les professions médicales, à l’intérieur et entre les établissements de soins ainsi qu’à travers les frontières organisationnelles et géographiques. Il précise que très peu de pays relevant de son domaine de compétence ont réellement pris la mesure de ces défis.

26. Dans le cadre juridique européen, il est important de noter que l’Union européenne n’a qu’une compétence juridique limitée en ce qui concerne les questions de santé, qui peut être utilisée principalement pour promouvoir la coopération et la coordination entre les États membres. Cependant dans le domaine de la protection des données il existe une réglementation commune sous la forme de la Directive 95/46/CE du Parlement européen et du Conseil, du 24 octobre 1995, relative à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données. Celle-ci définit des droits fondamentaux à la vie privée, mais l’interprétation exacte de l’exercice de ces droits dans la pratique relève de la législation nationale qui met en œuvre la directive. Il existe par conséquent un certain niveau de certitude juridique entourant les données à caractère privé relatives à la santé au sein de l’UE, mais des disparités importantes subsistent dans le détail de l’application de ces droits au niveau des États membres. Cette situation va changer en 2018 avec le nouveau règlement sur la protection des données qui en considère principalement la nature juridique (règlement et non plus directive).

27. Dans l’article 8 de la Directive, un statut particulier est accordé à toutes les informations médicales et relevant de la santé, avec quatre exceptions : (a) le consentement éclairé et explicite ; (b) le traitement des données dans l’intérêt vital du patient ; (c) le traitement des données nécessaire aux fins de la médecine préventive, des diagnostics médicaux, de l'administration de soins ou de traitements ou de la gestion de services de santé et par un praticien de la santé ; ou (d) le traitement présentant un intérêt public majeur.

28. En janvier 2012, la Commission européenne a proposé une réforme complète des règles de la protection des données au sein de l’UE. Le 4 mai 2016, les textes officiels du Règlement et de la Directive ont été publiés au Journal officiel de l’UE dans toutes ses langues officielles (Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l'égard du traitement des données à caractère personnel et à la libre circulation de ces données, et abrogeant la Directive 95/46/CE (règlement général sur la protection des données) et la Directive (UE) 2016/680 du Parlement européen et du Conseil du 27 avril 2016 relative à la protection des personnes physiques à l'égard du traitement des données à caractère personnel par les autorités compétentes à des fins de prévention et de détection des infractions pénales, d'enquêtes et de poursuites en la matière ou d'exécution de sanctions pénales, et à la libre circulation de ces données, et abrogeant la décision-cadre 2008/977/JAI du Conseil). Le Règlement est entré en vigueur le 24 mai 2016, mais ne s’appliquera qu’à partir du 25 mai 2018. La Directive est entrée en vigueur le 5 mai 2016 et les États membres de l’UE doivent la transposer dans leur législation nationale avant le 6 mai 2018. L’objectif de ce nouvel ensemble de règles est de redonner aux citoyens le contrôle de leurs données personnelles et de simplifier l’environnement réglementaire pour les affaires. La réforme de la protection des données est l’un des principaux moteurs du Marché unique numérique, qui est une priorité de la Commission. La réforme permettra aux entreprises et aux citoyens européens de pleinement tirer profit de l’économie numérique.

29. Le nouveau Règlement proclame que le traitement des données à caractère personnel devrait être conçu pour servir l'humanité. Le droit à la protection des données à caractère personnel n'est pas un droit absolu ; il doit être considéré par rapport à sa fonction dans la

Page 9: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 9 -

société et être mis en balance avec d'autres droits fondamentaux, conformément au principe de proportionnalité. Le présent règlement respecte tous les droits fondamentaux et observe les libertés et les principes reconnus par la Charte, consacrés par les traités, en particulier le respect de la vie privée et familiale, du domicile et des communications, la protection des données à caractère personnel, la liberté de pensée, de conscience et de religion, la liberté d'expression et d'information, la liberté d'entreprise, le droit à un recours effectif et à accéder à un tribunal impartial, et la diversité culturelle, religieuse et linguistique.

30. Le nouveau Règlement reconnaît que les objectifs et les principes de la Directive 95/46/EC restent solides, mais que celle-ci n’a pas empêché une fragmentation de la protection des données à travers l’Europe, ni une incertitude juridique et une perception largement répandue dans le public qu’il existe des risques importants pour la protection des personnes physiques, notamment dans le domaine de leur activité en ligne.

31. En ce qui concerne le consentement, le Règlement stipule ce qui suit :

Le consentement devrait être donné par un acte positif clair par lequel la personne concernée manifeste de façon libre, spécifique, éclairée et univoque son accord au traitement des données à caractère personnel la concernant, par exemple au moyen d'une déclaration écrite, y compris par voie électronique, ou d'une déclaration orale. Cela pourrait se faire notamment en cochant une case lors de la consultation d'un site internet, en optant pour certains paramètres techniques pour des services de la société de l'information ou au moyen d'une autre déclaration ou d'un autre comportement indiquant clairement dans ce contexte que la personne concernée accepte le traitement proposé de ses données à caractère personnel. Il ne saurait dès lors y avoir de consentement en cas de silence, de cases cochées par défaut ou d'inactivité. Le consentement donné devrait valoir pour toutes les activités de traitement ayant la ou les mêmes finalités. Lorsque le traitement a plusieurs finalités, le consentement devrait être donné pour l'ensemble d'entre elles. Si le consentement de la personne concernée est donné à la suite d'une demande introduite par voie électronique, cette demande doit être claire et concise et ne doit pas inutilement perturber l'utilisation du service pour lequel il est accordé.

Il précise en suite que « le consentement ne devrait pas être considéré comme ayant été donné librement si la personne concernée ne dispose pas d'une véritable liberté de choix ou n'est pas en mesure de refuser ou de retirer son consentement sans subir de préjudice ».

32. Dans le domaine de la recherche, le Règlement stipule que :

Souvent, il n'est pas possible de cerner entièrement la finalité du traitement des données à caractère personnel à des fins de recherche scientifique au moment de la collecte des données. Par conséquent, les personnes concernées devraient pouvoir donner leur consentement en ce qui concerne certains domaines de la recherche scientifique, dans le respect des normes éthiques reconnues en matière de recherche scientifique. Les personnes concernées devraient pouvoir donner leur consentement uniquement pour ce qui est de certains domaines de la recherche ou de certaines parties de projets de recherche, dans la mesure où la finalité visée le permet.

33. Dans le domaine de la santé publique, le nouveau Règlement mentionne que :

Le traitement des catégories particulières de données à caractère personnel peut être nécessaire pour des motifs d'intérêt public dans les domaines de la santé publique, sans le consentement de la personne concernée. Un tel traitement devrait faire l'objet de mesures appropriées et spécifiques de façon à protéger les droits et libertés des personnes physiques. Dans ce contexte, la notion de « santé publique » devrait s'interpréter selon la définition contenue dans le règlement (CE) n° 1338/2008 du Parlement européen et du Conseil (1), à savoir tous les éléments relatifs à la santé, à savoir l'état de santé, morbidité et handicap inclus, les déterminants ayant un effet sur cet état de santé, les besoins en matière de soins de santé, les ressources consacrées

Page 10: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 10 -

aux soins de santé, la fourniture de soins de santé, l'accès universel à ces soins, les dépenses de santé et leur financement, ainsi que les causes de mortalité. De tels traitements de données concernant la santé pour des motifs d'intérêt public ne devraient pas aboutir à ce que des données à caractère personnel soient traitées à d'autres fins par des tiers, tels que les employeurs ou les compagnies d'assurance et les banques.

Il précise en outre :

En combinant les informations issues des registres, les chercheurs peuvent acquérir de nouvelles connaissances d'un grand intérêt en ce qui concerne des problèmes médicaux très répandus tels que les maladies cardiovasculaires, le cancer et la dépression. Sur la base des registres, les résultats de la recherche peuvent être améliorés car ils s'appuient sur un échantillon plus large de population. Dans le cadre des sciences sociales, la recherche sur la base des registres permet aux chercheurs d'acquérir des connaissances essentielles sur les corrélations à long terme existant entre un certain nombre de conditions sociales telles que le chômage et l'éducation et d'autres conditions de vie. Les résultats de la recherche obtenus à l'aide des registres fournissent des connaissances fiables et de grande qualité qui peuvent servir de base à l'élaboration et à la mise en œuvre d'une politique fondée sur la connaissance, améliorer la qualité de vie d'un certain nombre de personnes et renforcer l'efficacité des services sociaux. Pour faciliter la recherche scientifique, les données à caractère personnel peuvent être traitées à des fins de recherche scientifique sous réserve de conditions et de garanties appropriées prévues dans le droit de l'Union ou le droit des États membres.

34. En outre, le Règlement (UE) n° 536/2014 du Parlement européen et du Conseil du 16 avril 2014 relatif aux essais cliniques de médicaments à usage humain joue un rôle important dans le domaine du « Big Data ».

35. Par ailleurs, afin d’aider les États membres à interpréter la directive en ce qui concerne leurs devoirs, un groupe de travail sur la protection des données composé des représentants des autorités nationales de protection des données a été constitué. Ce groupe est chargé de conseiller la Commission européenne sur la mise en œuvre de la directive dans les États membres. Appelé Groupe de travail « Article 29 » sur la protection des données, il a pour fonction de conseiller la Commission européenne sur la mise en œuvre de la Directive dans les États membres. En 2007, dans l’un de ses documents, le Groupe de travail a donné des indications sur le traitement des données personnelles contenues dans le rapport de santé électronique (RSE) (Protection des données à caractère personnel. Commission européenne, 2007). Le Groupe de travail n’a pas considéré le consentement comme un critère valable pour le traitement des données dans un dossier médical électronique. Il a mis en avant que, dans la mesure où la création d’un dossier médical est une conséquence nécessaire et inévitable de la fourniture de soins, un professionnel de santé peut avoir à traiter des données personnelles dans un RSE, et que, de ce fait, il pourrait être préjudiciable au patient de refuser d’accorder son consentement. Dans ce cas, le consentement ne serait pas donné librement, comme le requiert l’article 8 (2) (a). Le Groupe de travail a également suggéré qu’il pourrait être légitime que les garanties en matière de respect du caractère privé des données figurant dans un RSE prévoient un droit de refus. Dans un tel système, on partirait du principe que, pour les informations de santé générales, le patient a donné son consentement préalable à moins qu’il ne le retire explicitement. Le GTPD a néanmoins proposé, étant donné la grande diversité des informations saisies dans un RSE, que le système soit limité ; ainsi, une option de refus pourrait s’appliquer en général, mais il serait nécessaire de donner son consentement dans des cas spécifiques, pour le traitement d’informations particulièrement sensibles, comme les informations sur la santé mentale ou les infections sexuellement transmissibles. Le GTPD a également suggéré que des règles soient fixées pour que le (la) patient(e) puisse empêcher une catégorie particulière de professionnels de santé d’accéder à une certaine catégorie de données le (la) concernant. Il ne précise pas si une telle suppression devrait être indiquée en

Page 11: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 11 -

début de dossier mais souligne l’intérêt de l’utilisation de la technique des « enveloppes scellées ».

36. La Déclaration des droits de l’homme adoptée par les Nations Unies, la Convention européenne des droits de l’homme et la directive européenne relative à la protection des données ainsi que le nouveau Règlement sont les principaux instruments juridiques contraignants au niveau international qui abordent la protection de la vie privée. Il est intéressant de noter que deux des trois textes juridiques internationaux s’adressent uniquement à l’Europe. Il en résulte que la région européenne est dotée d’une protection juridique des données liées à la santé plus développée que les autres régions (OMS, Cadres juridiques pour la cybersanté : sur la base des résultats de la deuxième enquête mondiale sur la cybersanté, Collection de l’Observatoire mondial de la cybersanté, Volume 5, 2012, p. 27).

37. À l’échelon national et parallèlement aux réglementations mises en place dans les États membres de l’Union européenne, les États-Unis d’Amérique ont récemment adopté des lois qui constituent également un cadre juridique complet. Aucune réglementation ne concerne encore le « Big Data », mais les entreprises qui réalisent des traitements de ces données dans le domaine de la santé doivent se conformer à la réglementation fédérale sur la protection des données : la loi sur la transférabilité et la responsabilité en matière d’assurance maladie (HIPAA) et le Règlement sur la protection de la vie privée, qui protègent le caractère privé des informations identifiables sur la santé des personnes. L’HIPAA ne concerne pas exclusivement les données de santé et le dossier médical électronique, mais contient également certaines règles sur la protection des données. Ces deux réglementations prescrivent des garde-fous adaptés pour protéger la confidentialité des informations personnelles de santé et définissent les limites et les conditions de l’utilisation et de la diffusion qui peuvent être faites de ces informations sans l’autorisation du patient. Elles confèrent également aux patients des droits sur leurs informations de santé, notamment celui de consulter leur dossier et d’en obtenir une copie, et celui de demander d’y apporter des corrections.

38. Par ailleurs, la loi américaine sur la reprise et le réinvestissement (ARRA) de 2009 ainsi que la loi sur les technologies de l’information sanitaire pour la santé économique et clinique (HITECH) créent d’importantes mesures d’incitation pour une utilisation étendue des dossiers de santé électroniques et elles contiennent également des règles relatives à la protection des données qui concernent surtout des mesures relatives à la violation de la confidentialité des données de santé.

(Note : des observations sur l’accord Privacy Shield pourront être ajoutées ultérieurement.)

V. DEFIS ETHIQUES

V.1. Autonomie

39. L’autonomie en tant qu’exercice de l’autodétermination comprend plusieurs dimensions :

a. La capacité de l’individu concerné à accéder, comprendre, évaluer et appliquer les informations pertinentes.

b. L’accessibilité des informations pertinentes aux principaux enjeux.

c. Le choix entre différentes options.

d. La prise en compte des valeurs d’un individu, de ses préférences individuelles et de son état d’esprit dans le processus de prise de décision et la mise en œuvre de cette dernière.

e. La garantie du caractère volontaire de la démarche afin que l’individu puisse décider et agir indépendamment de toutes contraintes intérieures comme extérieures.

Page 12: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 12 -

f. La formation de la volonté comme la possibilité pour un individu de choisir un objectif ainsi que les moyens appropriés pour l’atteindre.

g. Une action définie comme résultat d’un agissement conscient ou de son abstention consciente.

40. L’autonomie, la responsabilité comme le consentement et la protection des personnes incapables d’exprimer leur consentement sont abordés dans les articles 5,6 et 7 de la Déclaration universelle sur la bioéthique et les droits de l’homme (DUBDH).

41. Traditionnellement, les deux garanties principales établies afin de protéger les droits des sujets humains dans le domaine de la recherche médicale sont le consentement et la dissociation ou l’anonymisation des données personnelles. Cependant, il apparaît que ces deux garanties ne sont pas suffisantes pour répondre aux défis majeurs que posent l’utilisation du « Big Data ».

42. Le consentement a toujours été reconnu comme un pilier important de la recherche et de la pratique médicales éthiques. Dans la Déclaration d’Helsinki, le consentement est entériné comme la garantie principale : « Dans la recherche médicale impliquant des personnes capables de donner un consentement éclairé, toute personne pouvant potentiellement être impliquée doit être correctement informée (…) [l]orsque le médecin ou une autre personne qualifiée en la matière a la certitude que la personne concernée a compris les informations, il doit alors solliciter son consentement libre et éclairé. ». De plus, la Déclaration universelle sur la bioéthique et les droits de l’homme de l’UNESCO indique que «[d]es recherches scientifiques ne devraient être menées qu’avec le consentement préalable, libre, exprès et éclairé de la personne concernée. consentement préalable, libre et éclairé de la personne concernée » (Art. 6).

43. C’est l’application du principe de respect qui garantit l’autonomie du sujet. Dans le cadre de projets de recherche uniques, comme des essais cliniques, le consentement est traditionnellement demeuré spécifique. Cela signifie que l’on demande le consentement des sujets pour un type spécifique de recherche. Dans la plupart des cas, le consentement ainsi obtenu ne s’étend pas à l’utilisation des échantillons et des données collectées au-delà du cadre du projet de recherche original ou primaire. Pour être valable, un consentement doit assurer que toutes informations pertinentes soient dévoilées aux participants potentiels et que ces derniers soient conscients de la nature, des risques et des avantages potentiels de la recherche, ainsi assurant un consentement volontaire informé.

44. La recherche dans le domaine du « Big Data » n’est pas en général autant spécifique que dans d’autres domaines comme les essais cliniques ou la biomédecine. La potentielle utilisation future des données ne peut être anticipée. Cette utilisation se fait sous différentes formes et implique de nombreuses interrelations entre des sources de données multiples et changeantes de nature médicale comme non-médicale. Cette situation remet en question la notion traditionnelle du consentement ; et a suscité de nombreux appels à repenser celui-ci selon un modèle approprié permettant à la fois une large utilisation des données et le respect du droit des participants ou patients à l’autonomie et au droit à l’autodétermination. Tous les modèles de consentement pour l’utilisation du « Big Data » devraient ainsi être adaptés au contexte, que ce soit pour dans le cadre de projets de recherche ou des soins de santé, en prenant en compte l’écart considérable de compréhension qui existe entre fournisseurs et utilisateurs de données et qui pourrait avoir des implications dans le processus de consentement.

45. Déjà dans le domaine des biobanques, de nouvelles propositions de dispositions relatives au consentement ont été avancées comme l’idée d’un consentement général. Le consentement général se définit à grands traits comme un consentement à l’utilisation future non précisée des données collectées. Cette proposition est considérée comme particulièrement utile dans les situations où lorsque le consentement initial est donné, il est impossible de prédire comment les données seront utilisées dans le futur. Cependant, le concept de consentement général suscite également des inquiétudes étant donné qu’un

Page 13: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 13 -

individu ne peut contrôler les usages futurs de ses données ou du moins que son contrôle sur ces dernières peut être affaibli.

46. L’idée de consentement général ne s’oppose pas nécessairement à l’idée de consentement « spécifique » car un tel consentement peut dans une certaine mesure être à la fois général et spécifique. Le consentement général peut couvrir une large gamme d’activités répondant à une fin déterminée, tel que par exemple la recherche des causes de maladies complexes tout en étant restreint à des usages déterminés limités, même de manière vague. Le concept de consentement général fonctionne typiquement à un niveau d’abstraction supérieur à celui de consentement plus étroit, dans lequel les méthodes et les objectifs sont clairement définis (Nuffield Council).

47. Le modèle du consentement général laisse l’essentiel du modèle de consentement éclairé intact. La différence majeure est que l’individu consent simplement à toutes les recherches possibles qui pourraient être faites avec ses informations par rapport à un domaine ou une piste de recherche donnée. Ce type de consentement ne signifie pas que l’individu consent à tous les types de recherche mais à différentes recherches dans le même ordre d’idée ou domaine. Cette formule de consentement éclairé est la plus répandue dans le contexte des biobanques et est utilisée en Europe, où les individus consentent de manière générale à toutes les recherches possibles pouvant être effectuées avec leurs tissus dans un même domaine ou des domaines similaires selon un même ordre d’idée. Ce modèle bénéficie également d’une attention accrue dans les pays en développement et particulièrement en Afrique dans le cadre de la génomique et des biobanques. Dans tous les cas, général ne signifie pas global.

48. Un autre modèle de consentement est la mise en œuvre d’un consentement négatif, pour lequel les chercheurs peuvent utiliser les données de santé sauf si l’individu le refuse expressément. Le choix de mettre en place un consentement négatif donne la priorité à des valeurs distinctes par rapport au choix de mettre en place un consentement positif. Alors que le consentement positif met l’accent sur la protection des choix informés et autonomes, le consentement négatif met l’accent sur la collecte de données. Si mal-exécuté, le consentement négatif soulève de sérieuses inquiétudes éthiques. En l’absence d’informations suffisantes et adéquates sur les conséquences potentielles de l’autorisation de la collecte d’échantillons biologiques et de données, proposer un droit de retrait ne peut pas légitimement être considéré comme équivalent à l’obtention d’un consentement éclairé. Cependant dans de nombreux cas, les individus sont insuffisamment informés de ces conséquences car une fois éduqués et informés les donneurs potentiels sont moins disposés à participer ; il n’y a donc que peu d’incitation pour les praticiens de fournir les informations et l’éducation appropriées. Avec l’adoption du consentement positif, les incitations sont inversées. Etant donné que les données ne peuvent être collectées pour des usages ultérieurs sans consentement, les praticiens ont des incitations à expliquer ces derniers aux donneurs, même si seulement en termes généraux (Elizabeth R. Pike, 2015).

49. Le processus réversible ou irréversible de dissociation des données (anonymisation) ne semble plus être en mesure de fournir des garanties de protection suffisantes étant donné que les interrelations et interconnexions de tant de volumes de données, provenant de sources différentes mais concernant une unique personne, facilite l’identification des individus. Le principe d’anonymisation comme garantie de la confidentialité des données n’existe plus depuis que les interconnexions entre les données permettent d’extraire de ces dernières l’identité d’un individu donné.

50. Néanmoins et bien qu’il ne faille pas négliger le fait que l’autonomie et la confidentialité des données sont en lien direct avec le respect de la dignité de chacun, ils existent des intérêts collectifs majeurs à soutenir le développement de la recherche dans le domaine du « Big Data ». Ainsi, un équilibre doit être trouvé entre intérêts individuels et intérêts collectifs.

51. Même les potentiels avantages de l’accès du public à l’information médicale pourraient être considérables. Alors que les financements gouvernementaux pour la recherche se font

Page 14: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 14 -

de plus en plus rares, la mise en disponibilité de larges jeux de données de très grande qualité à très faible voire aucun coût pourrait devenir très importante dans la perpétuation du progrès scientifique (Sharona Hoffman, 2014).

52. Afin de surmonter l’ensemble de ces difficultés, un nouveau modèle basé sur les principes de participation et de transparence a été proposé. Cela permettrait d’instituer un nouveau cadre pour faire face aux problèmes causés par la technologie en se réappropriant certains aspects caractéristiques des technologies elles-mêmes afin de promouvoir davantage de participation de la part des sujets et davantage de transparence de la part des institutions publiques et privées.

53. Ce nouveau modèle appelé “consentement dynamique” exige l’implication des pouvoirs publics à la fois comme moyen de garantir les droits des individus mais aussi comme moyen de promouvoir la participation des individus à travers l’éducation et l’information. Ce modèle appelle à valoriser et responsabiliser les participants et patients afin que ces derniers soient en mesure de surveiller l’usage fait de leurs données sanitaires dans le cadre du « Big Data » à travers une participation active qui doit rester garantie. Le consentement dynamique permet aux individus de contrôler l’usage fait de leurs données à travers des mécanismes comme des portails de consentement.

54. Comme indiqué par le Nuffield Council au Royaume-Uni, une participation continue de la part des sujets peut avoir l’avantage de permettre à ces derniers de déterminer les possibilités de recherches à travers leurs décisions de consentir à l’usage ou non de leurs données ; ‘votant’ ainsi pour certains projets. Alors que ce modèle de consentement fonctionne bien dans les pays développés dont les technologies avancées permettent aux patients de surveiller comment leurs données sont utilisées à travers un système de bases de données ; sa mise en œuvre dans des environnements moins avancés pourrait rencontrer de nombreux défis tels qu’un manque de technologie locale et des faibles taux d’alphabétisation qui entraveraient la pleine compréhension des patients dans le cadre des soins de santé et des participants dans le cadre de la recherche.

55. Une participation véritable, c’est-à-dire une participation où les patients font un choix sur comment l’information est utilisée et où ce choix est respecté, sert au moins deux objectifs bioéthiques majeurs. Tout d’abord cela empêche l’exploitation. Ensuite, la participation permet le respect du patient et préserve sa dignité et autonomie. L’individu participe de manière effective au processus. D’une certaine manière le projet devient une entreprise partagée ou commune avec le chercheur. Avec un consentement éclairé véritable, l’individu finit réellement par partager les objectifs du chercheur et n’est ainsi ni utilisé ni exploité.

(Note : Ce chapitre se concentre principalement sur la recherche médicale. D’autres domaines peuvent être également traités.)

V.2. Vie privée et confidentialité

56. D’après l’article 9 de la DUBDH, la vie privée des personnes concernées et la confidentialité des informations les touchant personnellement devraient être respectées. Ces informations ne devraient pas être utilisées ou diffusées à des fins autres que celles pour lesquelles elles ont été collectées ou pour lesquelles un consentement a été donné.

57. Une telle protection de la vie privée et de la confidentialité est confrontée à de nombreux défis à l’ère du « Big Data ». Les principes de protection traditionnels des données comme la restriction d’utilisation à certaines fins, le nombre limité et la minimisation des données, les mesures de protection spéciales pour les données sensibles, le traitement équitable des données et la protection des droits des individus concernés, ont été largement mis en œuvre afin de protéger la vie privée bien que les schémas de protection et les concepts sous-jacents diffèrent selon les régions du monde.

58. Cependant le « Big Data » entraîne par essence un changement et une ouverture des finalités, la non-limitation des données, un processus non transparent, peu de protection des

Page 15: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 15 -

données afin d’en extraire autant de connaissance que possible et l’absence de transparence pour les individus concernés. Comme Rini van Est et son équipe l’ont déterminé dans une étude pour le Sommet mondial des Comités nationaux d’éthique et de bioéthique en 2016 : « Alors que les individus deviennent de plus en plus transparents, notre environnement technologique devient de plus en plus opaque ». Cela est d’autant plus vrai au regard des algorithmes qui deviennent de plus en plus compliqués et de moins en moins compréhensibles à l’ère du développement de l’intelligence artificielle et de l’apprentissage profond.

59. De plus de nouveaux développements émergent : en intégrant de larges quantités de données de sources de nature diverse, il devient possible de mettre en œuvre de plus en plus de profilages différents. Cela permet d’agir sur les groupes en se basant sur des profils spécifiques de sorte que la vie privée des individus n’est plus protégée de manière adéquate bien que les noms de ces derniers demeurent inconnus ; cela n’est par exemple en effet pas le cas des adresses IP des smartphones ou des ordinateurs. Ainsi la vie privée du groupe doit également être protégée.

60. En outre, la protection de la vie privée comme concept normatif a prouvé être davantage qu’une simple exigence de protection des données. Plusieurs conceptualisations sont débattues. A propos du « Big Data », la distinction de sept types effectuées par Finn et al. (2013) semble être la plus utile : vie privée de la personne (caractéristiques corporelles et fonctions), de comportement et d’action, de communication personnelle, de données et d’images, de pensées et sentiments, de lieu et de temps et enfin d’association.

61. Afin d’éviter tout malentendu, nous utiliserons ci-après le terme « vie privée » dans le sens relatif au droit au respect de la vie privée (qui signifie davantage que données personnelles) dans les domaines de la vie ou des données que les individus veulent conserver privés pour eux-mêmes, ou au moins avec certains membres spécifiques de leurs familles ou de leur entourage. Ainsi le terme ne sera pas utilisé dans un sens relatif à l’intégrité et l’autonomie comme cela est utilisé dans le cadre de certaines juridictions légales pour lesquelles, vie privée signifie quelque chose de plus, une sphère d’autodétermination de l’individu où ce dernier a non seulement la faculté d’exclure les autres mais de décider librement.

62. Alors que les individus ont des intérêts personnels liés à la protection de leur vie privée, ils partagent également des intérêts collectifs liés au recours accru de l’utilisation des données dans le cadre de la recherche médicale. Cet intérêt public général, qui consiste à protéger et garantir des objectifs valorisés par la société, peut entrer en conflit avec le respect de la vie privée des individus. Néanmoins la relation entre intérêt public et intérêt privé n’est pas celle d’une simple opposition. Les deux sont mutuellement entremêlés : il y a des intérêts privés à l’œuvre dans l’accomplissement de buts communs et un intérêt public dans la protection de la vie privée des individus, qui encourage la coopération. Cette relation complexe conduit au besoin de réconcilier l’articulation du privé au sein du public et du public au sein du privé comme le Nuffield Council l’a déjà fait remarquer.

63. D’après plusieurs sondages, nous savons que la population est avertie du peu de contrôle qu’elle a sur la collecte et l’exploitation de ses données quand bien même une majorité voudrait avoir un certain degré de contrôle. Sur le long-terme cette situation aboutira à un manque de confiance généralisé. La perte de la confiance pourrait bien causer de sérieux dommages aux futurs et essentiels efforts et projets visant à promouvoir des objectifs de santé publique.

64. Afin de protéger la vie privée et les biens publics en même temps, il est essentiel que la population soit capable de croire dans le bon usage et dans la protection de leurs données de santé à travers un mélange d’approches reposant sur la loi, la gouvernance, la surveillance publique, respect de la vie privée dès la conception et respect de la vie privée par défaut.

65. Les nouveaux modèles de participation dans le processus de collecte de données et

Page 16: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 16 -

dans leur exploitation présentés dans le chapitre sur l’autonomie, vont dans la direction suivante : les sujets desquels les données sont collectées, participent dans le processus afin de garantir l’objectif prévu par l’utilisation des données et les moyens associés ce qui permet de préserver leur confidentialité. Des systèmes efficaces de gestion de protection des données, la responsabilisation des participants et de la société en général ainsi que des modèles innovants de propriété des données et de tutelle doivent être développés afin de protéger la vie privée. La qualité de l’éducation publique des participants et patients tout comme de l’ensemble de la population sur les implications de l’utilisation du « Big Data » est également d’une importance majeure.

(Note : La confidentialité doit être traitée de manière séparée.)

V.3. Propriété

(Note : A ajouter)

V.4. Justice

V.4.1. Fracture numérique

66. La fracture numérique (appelée aussi l’écart numérique) constitue l’un des défis majeurs du processus de démocratisation de l’information et de la communication et par conséquent du développement. La technologie numérique est de fait un atout majeur pour promouvoir le développement et lutter contre la pauvreté de sorte qu’il s’agit de l’un des objectifs des Objectifs du Millénaire pour le développement des Nations Unies concernant le renforcement du partenariat mondial pour le développement. Une des cibles était de s’assurer que les avantages des nouvelles technologies et particulièrement les technologies de l’information et de la communication (TIC) étaient, en coopération avec le secteur privé, mis à disposition de tous. Un tel programme a permis d’augmenter le niveau d’information des populations, en particulier celui des populations les plus pauvres et les plus enclavées, le niveau d’éducation, ainsi que l’accès à des biens et des services de meilleure qualité. Concernant le secteur de la santé, cette stratégie a permis de mieux prévenir les problèmes de santé grâce à une meilleure promotion de la santé, et a aussi permis d’étendre de manière significative l’offre de soins à travers notamment la télémédecine. Les populations qui ont accès aux technologies de l’information et de la communication comme les professionnels peuvent s’informer à propos des problèmes de santé et des moyens de prévention et de prises en charge, parfois avant même de consulter un professionnel de santé. Il s’agit d’un développement positif concernant la prise de conscience et les connaissances de la population à la base de toute action de santé publique.

67. De 2000 à 2015, une nette amélioration de l’accès aux TIC au niveau mondial a pu être observée, notamment dans les domaines de la téléphonie mobile et de la connectivité mobile (Figure 1, ITU 2015). Les smartphones sont de plus en plus abordables et répandus. La capacité croissante de traitement de l’information aide à fournir des services fluides transportant des masses de données à davantage de personnes dans tous les secteurs, dont les banques, le commerce de détails, les transports, mais aussi la santé et l’éducation. La proportion de la population couverte par le réseau cellulaire mobile 2G a augmenté de 58% en 2001 à 95% en 2015. Le nombre d’abonnements de téléphonie mobile a pratiquement été décuplé sur la même période, passant de 738 millions en 2000 à plus de 7 milliards en 2015. Les bonnes performances de la téléphonie mobile ont contribué à la mise en œuvre d’initiatives visant à renforcer les connaissances et compétences du public et de l’ensemble des acteurs dans le combat contre les maladies non-transmissibles. Par exemple, le programme Be Healthy Be Mobile est mis en œuvre dans plusieurs pays (l’Inde, l’Egypte, le Sénégal, le Costa Rica, la Zambie). Cette technologie étant à propos de messages SMS est aisément accessible pour la plupart des pays en voie de développement bénéficiant d’une bonne couverture de téléphonie mobile.

68. Le taux de pénétration de l’Internet a augmenté passant de juste 6% de la population mondiale en 2000 à 43% en 2015, à cette même date 46.4% des foyers mondiaux étaient

Page 17: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 17 -

couverts. Par conséquent, 3,2 milliards d’individus sont connectés à un réseau mondial d’application et de contenus, dont des contenus crées par les utilisateurs et les réseaux sociaux. Les rapides progrès des technologies fixes et sans fil haut débit permettent d’augmenter de manière constante le type et la qualité des services disponibles. Grâce au développement de réseaux sans fil, les problèmes d’infrastructure ont été surmontés, permettant à de nouvelles zones de se connecter à Internet. Le taux de pénétration de l’Internet a été multiplié par quatre entre 2010 et 2015 atteignant alors 47%.

69. Malgré ces avancées dans l’accès aux TIC, d’importantes disparités persistent voire tendent à s’accroître entre les pays ainsi qu’au sein de ces derniers. L’analyse de la couverture Internet des ménages montre qu’il existe de claires différences entre les niveaux économiques des pays. Ainsi, en 2015, la couverture en Internet en Europe était de 81.2%, bien supérieure à la couverture mondiale moyenne et nettement supérieure à la couverture Internet en Afrique de 10.7%. A peine un tiers (32%) de la population des pays en voie de développement utilise Internet contre 82% de la population des pays développés. Le contraste est encore plus frappant en Afrique sub-saharienne où moins de 21% de la population utilise Internet. On observe 48 internautes de moins pour 100 habitants dans les pays en voie de développement que dans les pays développés. Cela met la population des pays les moins avancés et des pays en voie de développement dans une situation où les possibilités d’accès aux contenus du NET (y compris à propos de la santé) demeurent très faibles tout comme, et ce plus important encore, les possibilités d’accès aux services associés. En conséquence et bien que les problèmes d’isolement et des difficultés d’accès aux infrastructures sanitaires et au personnel médical soient considérés comme prioritaires par les pays les plus développés, les innovations technologiques comme la télé-expertise, le télé-diagnostique ou la télé-consultation, qui constituent de réelles solutions à l’ensemble de ces problèmes ne peuvent être mises en œuvre. Cette situation renforce les retards pris par le développement des systèmes de santé dans les pays en voie de développement, accentuant les inégalités d’accès aux soins de santé.

Figure 1 : Couverture Internet des ménages (%), 2015 (ITU)

70. La bande passante Internet et les capacités des réseaux nationaux sont des éléments importants dans l’établissement d’un accès haut débit permettant le management approprié du « Big Data ». Cependant, dans de nombreux pays à faible revenu, l’étroitesse de la bande passante Internet internationale et la faiblesse des infrastructures nationales empêchent la mise à disposition de services Internet haut débit à des prix abordables. C’est particulièrement le cas des petits pays insulaires et des pays en voie de développement enclavés. Ces limites ont des effets concrets sur la rapidité et la qualité des connexions Internet et sur le type de

Page 18: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 18 -

services et d’applications auxquels les utilisateurs peuvent accéder. Par conséquent, les pays en voie de développement et les pays les moins avancés intègrent avec grande timidité le management du « Big Data » dans leurs offres. Le management du « Big Data » reste peu connu et très mal mis en œuvre dans ces pays car il exige de très larges bandes passantes et une bonne sécurité du trafic. En outre, le prix moyen de tels services demeure relativement élevé dans beaucoup des pays les plus pauvres.

71. Malgré une baisse importante entre 2008 et 2013, le prix de l’internet haut débit (fixe et mobile) demeure plus élevé dans les pays en voie de développement que dans les pays développés. En effet, moins de 1.6% du produit national brut par habitant était consacré à l’Internet haut débit dans les pays développés avant 2008 contre 25.8% dans le cas des pays en voie de développement. En 2013, dans presque 20 pays, principalement en Afrique sub-saharienne, le prix d’une offre de base Internet comprenant l’Internet haut débit fixe, représentait toujours plus de 50% du produit national brut par habitant. En raison de la rareté des ressources dans un contexte de priorités multiples, les pays en voie de développement sont ainsi forcés de limiter l’expansion des TIC. Les TIC demeurent donc un obstacle majeur au développement dans de nombreux pays à faible revenu notamment dans les petits pays insulaires ou les pays en voie de développement.

72. Il y a également de nombreuses inégalités parmi les pays en termes de compétences liées aux TIC et l’existence de contenus locaux pertinents. Ainsi même si un contenu innovant est offert à travers les TIC dans les pays développés, ces dernières ne peuvent pas être mises en place dans les pays en voie de développement car elles exigent, outre une infrastructure adaptée, des ressources humaines pour leur adaptation, mise en œuvre et évaluation. Cette situation soulève des problèmes éthiques comme celui des transferts massifs de données en l’absence de claires conditions ou de politiques de gouvernance adaptées. En effet de grandes quantités d’informations sont transférées des pays en voie de développement aux ressources techniques et humaines limitées, afin d’être traitées sans aucune garantie de protection des données ainsi transférées.

V.4.2. Partage des bienfaits

(Note : A ajouter.)

V.4.3. Non-discrimination

73. Dans de nombreux pays l’accès aux soins de santé ne repose pas sur un modèle public mais sur des modèles privés, qui sont gérés par des compagnies d’assurance privées, plus ou moins contrôlées et surveillées par les pouvoirs publics. Le « Big Data » offre la possibilité technique, dans le domaine des assurances maladies, d’empêcher ou entraver les individus d’accéder aux assurances en raison de la divulgation de ses données de santé. Mais les compagnies d’assurance devraient-elles connaître les risques spécifiques d’une personne dans ses moindres détails ? Il est très difficile de parler d’un modèle assuranciel qui repose traditionnellement sur la formulation d’un équilibre entre les risques collectifs plutôt qu’individuels.

74. Se développent également des modèles d’assurance fondés sur le comportement par exemple, l’assurance-vie, l’assurance invalidité, l’assurance automobile ainsi que l’assurance santé. Des taux d’assurance réduits ou d’autres types de primes sont offerts aux personnes assurées acceptant de transférer leurs données à propos de leur comportement au volant, leurs activités sportives, leurs habitudes nutritionnelles et leurs goûts de manière régulière via des dispositifs de suivi, des dispositifs portables et des applications. En ce qui concerne les assurances santé, cette situation peut créer des discriminations envers trois groupes de personnes. Ces discriminations peuvent soit prendre la forme d’un empêchement d’avoir accès aux prestations de santé soit, et c’est ce qui est attendu sur le long-terme, prendre la forme de désavantages. D’abord, les personnes discriminées seront celles qui ne veulent pas partager leurs données avec la compagnie d’assurance, que ces dernières puissent répondre aux critères comme marcher 10,000 pas par jour ou non. Ensuite, seront discriminées les

Page 19: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 19 -

personnes qui ne peuvent pas répondre aux critères en raison d’un handicap, d’une maladie ou d’une malchance indépendamment de leur volonté à partager leurs données. Ce sont exactement ces personnes qui ont un besoin spécifique de solidarité collective et de soutien social. Enfin, seront concernées les personnes qui ont différentes croyances que les compagnies d’assurance sur ce que signifie le concept de santé. Ces personnes par exemple pourraient préférer aider les réfugiés, prendre soin d’une personne handicapée ou s’engager dans une pratique spirituelle de bien-être plutôt que de marcher 10,000 pas par jour. Ces personnes contribuent peut-être davantage à l’état de santé général mais elles ne répondent pas aux critères donnés par les compagnies.

75. De plus, il existe de puissants algorithmes qui permettent d’établir le profil d’individus sans avoir à identifier leurs données personnelles afin de former des groupes qui peuvent ensuite recevoir des publicités, des recommandations et des offres ciblées. Ces groupes peuvent être construits selon de nombreux critères dont les problèmes de santé. Des discriminations et stigmatisations peuvent ensuite survenir à l’encontre de ces groupes, affectant même des individus n’ayant pas participé à la collecte initiale de données pour le profilage.

76. En tenant compte de ce fait, il doit être évalué de manière préalable dans quels domaines et de quelles manières, le « Big Data » peut contribuer au processus de discrimination. Des mesures appropriées devront alors être prises afin de prévenir les discriminations et stigmatisations selon l’article 11 de la DUBDH.

V.4.4. Durabilité énergétique et environnementale

77. Le « Big Data » pour usage médical est aussi un enjeu écologique en raison de son coût énergétique et des gains pouvant être obtenus grâce à une meilleure utilisation des ressources naturelles. Cependant il est surprenant de voir l’importance conférée aux potentiels avantages du « Big Data », dont les économies énergétiques qu’il devrait permettre de réaliser et le problème de l’effet de serre qu’il devrait contribuer à résoudre. Par exemple, un rapport du « Carbon War Room », un groupe industriel de lobby, affirme que la technologie machine-to-machine (M2M) peut « faciliter l’accroissement des rendements permis par les réseaux intelligents (smart grid) dans le secteur de l’énergie, optimiser le transport et la logistique, réduire l’empreinte énergétique des bâtiments, et réduire considérablement les émissions de gaz à effets de serre dans le secteur agricole. ». « Les compteurs intelligents, les réseaux intelligents, les villes intelligentes (…) vont contribuer à l’amélioration des connaissances sur les dépenses énergétiques et à réduire ces dernières ». Mais les réalités actuelles sont moins plaisantes, le service français Ecoinfo du CNRS a démontré par exemple non seulement combien les technologies de l’information sont consommatrices d’énergie mais aussi qu’elles produisent des gaz à effet de serre à tous les stades de leur cycle de vie.

78. Les infrastructures derrière l’informatique distribuée ou à distance ont une consommation énergétique et une empreinte carbone importantes. Ce coût est lié aux opérations de production ou collecte, d’analyse et de visualisation des masses de données numériques- en particulier avec l’arrivée conjointe de l’Internet des objets. Des infrastructures colossales sont déjà nécessaire pour entreposer ce flot de données, et nous devons encore ajouter le coût énergétique de leur traitement. Cela a inévitablement des répercussions sur le climat quand bien même l’impact carbone dépend du mix énergétique choisi par chaque pays.

79. En service, les éléments essentiels du « Big Data » peuvent être divisés en trois catégories : dispositifs terminaux, réseaux, et centre de données, qui consomment chacune une énergie électrique comparable. Les immenses centres de données sont probablement l’aspect le plus frappant de cette dépense énergétique. Ils réunissent des milliers de machines qui fonctionnent sans interruption. Outre l’énergie requise pour faire fonctionner cet équipement, les importants besoins de refroidissement doivent également être pris en compte. En 2013, les centres de données américains consommaient selon estimation près de 91 milliards de kilowattheures d’électricité (il s’agit de l’équivalent annuel de la production de 34 larges (500-megawatt) centrales au charbon-soit assez d’électricité pour alimenter tous les

Page 20: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 20 -

foyers à New-York City pendant deux ans) et devraient consommer 140 milliards de kilowattheures d’ici 20201.

80. Les divers appareils connectés quotidiennement (de 14 milliards actuellement, le nombre d’objets connectés mondialement devrait atteindre 125 milliards en 2025) représentent un autre coût, principalement non lié à leur usage. Tous les appareils connectés sont maintenant toujours allumés, même en mode « veille ». Environ 80% de la consommation énergétique des objets connectés est estimée être dédiée à maintenir la connectivité réseau. L’Agence internationale de l’énergie a déclaré que les objets connectés consommaient à l’échelle mondiale 616 TWh en 20132( la consommation de la Suède en un an). D’après un scénario provocateur de la compagnie Cisco, il se peut qu’un jour, peut-être en 2025, seules quelques machines auront le droit de communiquer, selon que leur adresse IP soit paire par exemple.

81. Un nouveau problème sera peut-être le besoin de mettre en place des aires de stockages locales dématérialisées (Cloud Storage). De plus en plus de gouvernements et d’entreprises déplacent leurs données entreposées dans le Cloud. Les principaux acteurs du stockage dématérialisé, Amazon, Google ou Microsoft se sont engagés depuis des années dans une course pour capturer ce marché.

82. Il existe également de nombreuses inquiétudes quant au possible impact sur la santé, de la pollution associée aux déchets créés par les objets connectés qui ne sont plus utilisés. A l’échelle globale, l’Université des Nations Unies (UNU) estime qu’en 2013, on comptait 53 millions de tonnes de déchets informatiques, alors qu’environ 67 millions de tonnes de nouvel équipement électrique et électronique étaient alors mis sur le marché. L’initiative Stopping the E-waste Problem3 (StEP), un effort commun mené par les organisations des Nations Unies, et des groupes locaux et industriels, prédit que d’ici 2017, le volume total annuel de déchets informatiques aura augmenté d’un tiers, atteignant environ 65,4 millions de tonnes.

83. Il y a également des inquiétudes en raison de l’impact écologique de la recherche et l’exploitation de certains composants des objets connectés comme les éléments des terres rares. Le terme terre rare décrit un ensemble de 17 éléments chimiques aux propriétés exceptionnelles. C’est grâce à ces terres rares que les couleurs de nos écrans d’ordinateur sont si vives, que nos téléphones portables ont des écrans tactiles et que les éoliennes peuvent générer de l’électricité. L’inconvénient est que leur extraction et leur transformation polluent, produisent des déchets radioactifs et déforment le paysage. L’Indonésie et l’Australie ont déjà été affectés.

V.5. Défis spécifiques de la recherche « Big Data » en santé

84. Les conseils de meilleure pratique concernent le « Big Data », dans le cadre de la recherche sur des échantillons collectés et conservés dans des biobanques académiques, ont déjà été publiés et discutés régulièrement par les recommandations d’organisations internationales comme la BBMRI-ERIC4. Les avancées récentes, qui incluent la mise en place de comités de patients examinant la gouvernance des biobanques et y compris l’analyse de l’utilisation de données à valeur commerciale potentielle, ainsi que d’un processus de suivi de l’information sur des recherches variées utilisant les données, permet aux patients d’être informés sur le long terme et leur donne une réelle possibilité de retirer leur consentement.

85. Afin d’aider dans le suivi de l’utilisation des données, des discussions entre les organisations de rédacteurs en chef des revues concernées ont mené à des initiatives comme la BRIF (Bioresource Research Impact Factor) initiative et le guide directeur CoBRA, développé afin de standardiser les citations de bio-ressources dans la littérature scientifique.

1 http://www.nrdc.org/energy/data-center-efficiency-assessment.asp 2 https://www.iea.org/publications/freepublications/publication/MoreData_LessEnergy.pdf 3 http://www.step-initiative.org/ 4 http://bbmri-eric.eu/

Page 21: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 21 -

86. Plusieurs questions spécifiques surviennent dans le cadre d’une telle recherche telles que le problème de l’obsolescence de la méthode utilisée pour améliorer les résultats. Ces derniers pourraient avoir besoin d’une nouvelle analyse, en commençant par la collecte primaire des échantillons biologiques. De manière analogue, en raison du contexte et des méthodes, il peut être nécessaire de recommencer l’analyse des résultats en partant des données primaires. De plus le coût de stockage ne peut être pris en charge par les équipes de recherche individuelles mais doit être assuré par les institutions de recherche.

87. Le domaine de la recherche présente des risques spécifiques de violation de l’anonymat des données en raison des puissants algorithmes utilisés. L’agrégation de données offre la possibilité de ré-identifier les individus à travers des recoupements de données sur les origines ethniques, la localisation, d’autres métadonnées, les dossiers de santé ou les données génétiques5. De plus, si des données anonymes à caractère personnel sont regroupées selon des critères géographique, socioéconomique, ethnique ou autres, l’anonymat des individus importe peu si les résultats du traitement des données affectent les groupes auxquels ils appartiennent avec un risque accru de discrimination et de stigmatisation. De tels effets ont un impact sur tous les membres de la communauté et non pas seulement sur ceux ayant donné leur consentement.

88. A qui appartiennent les données peut aussi être une question éthique même dans le domaine de la recherche. Compris en termes de « contrôle », la question de la propriété est au fondement de la responsabilisation des sujets des données, dans le but d’éviter toutes manipulations des données, y compris sous pression sociale, à des usages inacceptables. En tenant compte des possibilités de ré-identification, un contrôle permet aux sujets de restreindre les usages indésirables. Pour les biobanques, ce contrôle est pertinent étant donné qu’il est permis d’utiliser les données de recherche à des fins commerciales en autorisant l’accès aux données aux entreprises privées ou tiers.

89. De nombreuses différences opposent la recherche académique, à but non lucratif, à la recherche privée, tournée vers le profit. Dans ces cas, les informations personnelles sont vendues par les fournisseurs, générant de très importants revenus qui ne sont pas partagés avec les utilisateurs des services qui fournissent échantillons et données. Un exemple bien connu est celui de l’entreprise de dépistage génétique de Google, 23&me, qui a vendu les informations de ses clients, y compris leurs informations génétiques à des sociétés pharmaceutiques, avec pour objectif déclaré le développement de nouveaux médicaments. Les individus dont les données ont été vendues avaient consenti à l’utilisation de leurs données à des fins de recherche, mais il n’est pas clair qu’ils savaient que ces données seraient vendues à des sociétés pharmaceutiques privées et non données au monde universitaire. La même entreprise a déclaré vouloir « donner » ses tests aux minorités défavorisées afin que sa base de données soit plus diverse. Quel effet aura cette intention sur ces groupes de population ? Les problèmes éthiques soulevés par les tests génétiques directement accessibles aux consommateurs ont été adressés dans un rapport précédent du CIB6. Quand ces tests sont offerts aux populations vulnérables dans le but « d’exploiter » leurs informations à l’ère du « Big Data », ces problèmes se font d’autant plus pressants.

90. De plus l’effacement des frontières entre recherche médicale et soins de santé, et entre soins de santé et modes de vie, pourraient conduire certaines entreprises à augmenter le marché en jouant sur les craintes et les désirs. Un effort éducatif devrait être fait pour expliquer les différences entre corrélation et causalité, entre les hypothèses générées par le « Big Data » et leur validation par des recherches plus poussées

5 Choudhury, S., Fishman, J. R., McGowan, M. L., & Juengst, E. T. (2014). « Big Data », open science and the brain: Lessons learned from genomics. Frontiers in Human Neuroscience, 8, 239. doi:10.3389/fnhum.2014.00239. 6 UNESCO IBC. Report of the IBC on Updating Its Reflection on the Human Genome and Human Rights. Available online at: http://unesdoc.unesco.org/images/0023/002332/233258E.pdf

Page 22: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 22 -

91. Le principe de propriété des données peut également être un obstacle pour la recherche, empêchant par exemple certaines formes d’exploration des données ou de méta-analyses. Les législations nationales peuvent limiter de telles recherches, particulièrement si un transfert de données est impliqué.

92. Un autre problème survient avec la demande de certains journaux scientifiques de transférer toutes les séries de données utilisées dans l’obtention des résultats dans le répertoire de données de la revue afin de permettre à d’autres scientifiques de répliquer les résultats ou de les réutiliser dans une méta-analyse. Cela pourrait aussi conduire la revue à prendre des droits sur les bases de données et interdire ou rendre trop coûteuse l’exploration des données. Plusieurs lois nationales sont pour le moment en cours de discussion afin de permettre l’accès gratuit aux bases de données pour la recherche.

93. Compris comme un “avantage”, le principe de propriété peut aussi exiger des dépositaires des données de permettre aux personnes concernées de bénéficier et d’accéder au « Big Data » pour leurs usages personnels comme par exemple connaître leurs données génétiques. Cependant une telle accessibilité ne va pas sans risques, car elle ouvre le champ à des interprétations erronées des facteurs de risque dans le domaine génétique bien connues et nécessite donc des limites. Le consensus général est que les données collectées dans le cadre d’un processus de recherche n’ont pas le « niveau de confidentialité » requis en clinique et que par conséquence la personne n’aura pas accès à ses données personnelles (comme les séquences génétiques).

94. De plus les sujets des données doivent être capables d’exercer leur droit d’accès au prix d’un effort raisonnable afin que ce droit puisse être signifiant. Cela semble pratiquement impossible au regard de toutes les précautions prises pour protéger la confidentialité des données et les difficultés d’interprétation des données brutes pour un public non initié. Le « Big Data » exige des connaissances scientifiques avancées et des compétences techniques, qui nécessitent une éducation. Un autre impact est lié à la perte de contexte que peut introduire l’écart entre le sens donné par un individu et celui par la société dans sa globalité. A titre d’exemple, le conseil de manger cinq fruits ou légumes différents par jour donne lieu, après évaluation, à une diminution potentielle de 5% du risque du cancer du côlon. Ce conseil a un fort impact en terme de santé publique tandis qu’il ne produit qu’un changement insignifiant en termes de risques individuels. Les bases de données ne « contiennent pas le monde en plus petit » et il existe un risque que le profil global devienne une représentation de ce qui a été profilé7. L’interprétation de la signification des résultats du « Big Data » pour une personne donnée demeure l’un des buts fondamentaux de la relation entre patient et physicien. Ainsi une confiance excessive dans le pouvoir du « Big Data » est la conséquence récente et actuelle du développement de relations directes entre gestionnaires des bases de données et patients, excluant toute forme d’intervention de nature médicale. Une telle pratique n’existe pas dans le domaine académique mais se développe rapidement dans les secteurs de la recherche privée détenus par les entreprises commerciales.

95. Les méthodes du « Big Data » peuvent révéler des résultats inattendus potentiellement pertinent pour la santé d’un individu donné, ce que l’on appelle les découvertes fortuites. Cela soulève la question de savoir à propos de quels résultats les individus devraient être informés et de quelle manière. Le consensus général est d’anticiper ces découvertes fortuites et de demander aux sujets de la base de données de quelle manière ils veulent savoir ou non. La régulation dans le domaine du « Big Data » devrait prendre exemple sur les systèmes de réglementation expérimentés dans le domaine de la génétique. Au sujet des découvertes fortuites en génétiques, certaines associations professionnelles comme l’American College of Clinical Geneticists, a retenu une liste de gènes et de mutations pour lesquels une action préventive et/ou thérapeutique est possible et considère que les personnes doivent être

7 Bowker 2014 quoted by Mittelstadt BD and Floridi L. (2016) The Ethics of « Big Data »: Current and Foreseeable Issues in Biomedical Contexts Sci Eng Ethics 22:303–341

Page 23: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 23 -

informées en cas d'une telle découverte non sollicitée. D’autres organisations sont contre de telles listes parce que les résultats sont obtenus hors du cadre de la relation patient-physicien et manquent d’un processus de validation technique. Cela est particulièrement le cas pour l’imagerie médicale où les méthodes de recherche peuvent être très différentes de celles adoptées en clinique. Dans le cas de la recherche en « Big Data » il sera difficile de lister toutes les découvertes fortuites en raison de la grande quantité de découvertes possibles qu’il peut être compliqué de regrouper.

96. Dernier point mais non des moindres, l’objectivité du « Big Data » dans la description de la réalité sociale est souvent faussement représentée, en raison de l’excès de confiance conféré au « Big Data », argument d’autorité scientifique par excellence. La qualité des bases de données utilisées peut être questionnée. Par exemple, les données des dossiers de santé sont de manière générale codées pour des travaux cliniques de routine sans être standardisées ou sans se soucier de question d’interopérabilité et peuvent en conséquence devenir une source de biais. Cela soulève également la question de la robustesse et du besoin pour les chercheurs d’accéder à des données brutes pour des besoins de vérification, de méta-analyse et de réinterprétation y compris d’aspects comme les échelles temporelles et les populations

(Note : Aspects à ajouter, bases de données longitudinales et translationneles avec un nombre estimé de patients de plus de 500 millions, suivi des progrès et surveillance en temps réel…)

VI. GOUVERNANCE

97. Diverses initiatives sont en cours pour faciliter le partage de données. On peut à titre d’exemple citer les travaux de l'OCDE sur l'apprentissage des systèmes de soins de santé, les projets de l'UE tels que Corbel et des instruments pratiques qui facilitent le partage des données telles que l'IMI 2014, et les initiatives d'industrie. (OECD 2013, OCDE 2015, Corbel, IMI 2014, PhRMA 2014) Récemment, l'EMA a publié ses conseils sur la mise à disposition données anonymes individuelles (essai) (EMA 2016). Ces développements offrent de grandes potentialités, tout en nourrissant des inquiétudes concernant le respect des droits des personnes dont les données personnelles sont traitées, le devoir de confidentialité et la protection des intérêts des participants, le devoir de confidentialité de la profession médicale et la protection des intérêts des participants, des praticiens et des chercheurs (Cohen 2013, Laurie 2015, Lea 2015).

98. Bien que les mécanismes de consentement et des droits individuels soient essentiels à la protection de la vie privée, il y a au moins quatre dangers liés à la dépendance excessive à ces mécanismes à l'ère du « Big Data ».

a. Premièrement, les individus ne sont plus en mesure de garder une trace ou prendre des décisions importantes concernant l’utilisation de leurs données personnelles. L'ampleur et la complexité du traitement des données à caractère personnel, rendent pratiquement impossible pour les gens d’en suivre l’évolution. Même si les individus pouvaient suivre l’évolution et étaient informés, leurs décisions pourraient être faussées par diverses difficultés dans la prise de décision. Dans le contexte de la recherche en santé, des efforts sont faits pour améliorer le processus d'obtention du consentement par l'utilisation de portails en ligne et en engageant des individus en tant que participants actifs [Kaye et al, 2014]. Bien que ces efforts soient louables, il faut reconnaître que les individus ne peuvent s’engager dans des procédures de consentement que de manière sélective. Les modèles de « consentement général » reconnaissent ce fait dans une certaine mesure en invitant les gens à accepter un large éventail d'utilisations des données. Le consentement général est de plus en plus accepté (WMA, CIOMS), mais doit être complété par un système de gouvernance éthique qui garantit la bonne utilisation des données.

Page 24: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 24 -

b. Deuxièmement, même si les individus étaient en mesure d'exercer un contrôle significatif sur leurs données, cela ne constitue pas en soi une garantie de protection de tous leurs intérêts pertinents. Bien que donner aux individus un tel contrôle respecte leur autonomie, il ne réduit pas nécessairement le risque de préjudice (Nuffield, 2015). Cela ne met pas non plus de côté les obligations morales ou juridiques de ceux qui ont accès aux données personnelles, telles que les obligations énoncées dans le chapitre IV du GDPR (règlement générale de protection des données). Indépendamment des termes d’utilisation des données fixées par le consentement fourni, les intérêts des personnes concernées ne peuvent seulement être garantis de manière fiable que par des mesures efficaces et globales de gouvernance.

c. Troisièmement, trop compter sur le consentement et les droits individuels pourrait entrer en conflit avec l'objectif d'éliminer les obstacles juridiques de la recherche scientifique (transfrontalière). Dans la recherche intensive en santé des données, les données obtenues transgressent les frontières internationales et il est souvent impossible ou pratiquement impossible d'obtenir le consentement individuel. Dans une telle situation, les mesures de gouvernance sont nécessaires pour justifier l'utilisation de données personnelles sensibles dans la recherche en santé.

d. Quatrièmement, les dispositions actuelles, dans lequel les services en ligne sont fournis gratuitement, mais seulement si la personne accepte une utilisation illimitée (commerciale) des données par le fournisseur de services, sont manifestement injustes. Les avantages accordés aux fournisseurs sont disproportionnellement grands et les possibilités de contrôle individuel sont pratiquement absentes. Toutes ces circonstances conduisent à la conclusion qu'il est crucial de développer et d'appliquer une structure de gouvernance exhaustive à plusieurs niveaux pour une utilisation responsable des données. Il est également important de noter que, alors qu’à notre époque, l'individu devient de plus en plus transparent parce que nous en savons de plus en plus sur cette personne, les systèmes ont tendance à devenir de plus en plus opaques. Cela doit être contré par la création de systèmes de gouvernance plus transparents. Un tel système de gouvernance peut suivre différents modèles, mais doit dans tous les cas être une structure publique, ou du moins un partenariat public-privé. Cela ouvre également la possibilité d’une participation publique importante des patients, ce qui est une condition préalable.

99. Le droit fondamental à la protection des données offre une base conceptuelle et juridique pour de telles mesures de gouvernance globales et alternatives, qui sont nécessaires pour garantir une utilisation moralement et légalement acceptable des données. Le droit à la protection des données garantit un système complexe de l'information des règles de gouvernance, qui est plus complet et varié que les droits individuels garantis par le droit fondamental à la vie privée. Le consentement est, par exemple, que l'un des divers motifs d'adhérer au principe de légalité. Le principe de légalité exige que chaque traitement des données personnelles nécessite un fondement légitime prévu par la loi, mais ne favorise pas nécessairement le consentement. En outre, le principe de légalité est seulement l'un des principes fondamentaux du droit de la protection des données. Son essence est le système global d’équilibre des pouvoirs, régissant les activités de traitement de données d'un large éventail d'acteurs à travers un ensemble complet de principes et de règles. Il vise à compléter les droits individuels avec une allocation efficace des responsabilités et des devoirs, parmi les principales entités impliquées dans le traitement des données personnelles. Bien que ce système de protection des données personnelles ait ses propres inconvénients, sa garantie comme un droit fondamental fournit une base précieuse pour discuter et agir sur les défis modernes de gouvernance de l'information.

Page 25: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 25 -

100. Cette gouvernance devrait aborder les questions réglementaires et éthiques liées à l'accès et la publication des données, les liens et aussi la gouvernance des ensembles de données combinés du consortium. Une partie d'un tel arrangement devrait être que les individus (peuvent) savoir à quoi ils peuvent s’attendre quand ils acceptent que leurs données soient recueillies. Les modalités de gouvernance doivent au moins inclure des règles pour la surveillance éthique et les modalités de gestion des données :

101. Une supervision éthique:

a. Une déclaration claire de l'objectif de la base de données.

b. Des procédures de consentement, re-contact et re-consentement.

c. Des dispositions de rétractation, et une description de la mesure dans laquelle la rétractation est possible.

d. Dispositions pour la protection de la vie privée.

e. Des dispositions pour fournir une protection spéciale pour l’utilisation des données des personnes ou des groupes vulnérables.

f. Des critères pour la distribution et le partage des données.

g. L'évaluation des demandes d'utilisation secondaire des données.

102. Dispositions pour la gestion des données :

a. Des dispositions pour le stockage des données, y compris le contrôle de la qualité et des garanties de la protection de la vie privée et la confidentialité.

b. Des modalités d'accès aux données y compris des dispositions pour le partage des données, et les critères d'accès, y compris l'établissement de priorités en faveur de la recherche et des dispositions pour le règlement de la concurrence entre les chercheurs.

c. Des dispositions concernant la durée de stockage des données et les politiques après la mort d'un participant.

d. Des dispositions pour la façon dont les données seront traitées en cas de changement de propriétaire ou de clôture.

103. La recherche du « Big Data » dépend généralement de la volonté de larges groupes de patients et des citoyens, ce qui rend leur participation significative non seulement justifiée mais aussi urgente. Malgré la diversité des initiatives visant à impliquer les patients et le public, une meilleure pratique pour une telle participation est absente (Kaplan et al., 2013). Des exemples de questions importantes sont : Quelle est la meilleure façon de représenter ces parties prenantes dans l'organisation d'un modèle de gouvernance « Big Data » ? Quels sont les préférences des patients et du public concernant les moyens de protéger les données tout en les rendant accessibles et de bonne qualité pour les bonnes raisons ? Un alignement optimal entre le public, les patients et les autres parties prenantes sera nécessaire. Tout d'abord, les modalités de communication avec les participants devront être établies afin d'être transparent, de promouvoir la confiance et le respect de leur autonomie. Deuxièmement, des dispositions doivent être mises en place pour permettre une participation substantielle des participants. Par conséquent, un modèle de gouvernance a aussi besoin de :

a. De dispositions qui permettent aux participants de rester informés sur les activités de recherche en cours et sur les nouvelles.

b. De dispositions relatives à la communication des résultats de recherche globale et individuelle aux participants.

c. De dispositions pour l'engagement des participants dans la conception et l’adaptation en continue des procédures de gouvernance, notamment en matière de surveillance de l'éthique et de la communication avec les donateurs.

d. Dispositions pour le partage des avantages.

Page 26: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 26 -

e. Communication des intérêts commerciaux et des collaborations avec les partenaires commerciaux.

104. Le CIB recommande l'adoption d'un traité international sur la protection des données par les Etats membres. Ce traité doit être fondé sur le principe de proportionnalité qui dans ce cas signifie que tout système de gouvernance doit remplir les conditions de légalité, pertinence, nécessité et efficacité. Sur demande, le CIB est prêt à préparer un tel traité. Chaque pays pourra ensuite créer au sein de sa propre législation des lois spécifiques pour chaque pays, en vertu desquelles un organisme chargé de la surveillance de ces systèmes de gouvernance pourrait être créé. Un tel organisme permettrait également de fournir des points d’entrée clairs pour le contrôle public.

Page 27: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 27 -

BIBLIOGRAPHIE

Cohen, J. E. 2013. What privacy is for. Harvard Law Rev, 126: 1904-1933. Coordinated Research Infrastructures Building Enduring Life-science Services (CORBEL). n.d. Available at: http://www.corbel-project.eu/home.html European Medicines Agency (EMA). 2016. External guidance on the implementation of the European Medicines Agency policy on the publication of clinical data for medicinal products for human use. EMA, London. Available at: http://www.ema.europa.eu/docs/en_GB/document_library/Regulatory_and_procedural_guideline/2016/03/WC500202621.pdf European Union (EU). General Data Protection Regulation (compromise text after trilogue). Available at: http://www.statewatch.org/news/2015/dec/eu-council-dp-reg-draft-final-compromise-15039-15.pdf Innovative Medicines Initiative (IMI). 2014. Code of Practice on Secondary Use of Medical Data in Scientific Research Projects, final draft 27 August 2014. Available at: http://www.imi.europa.eu/sites/default/files/uploads/documents/CodeofPractice_SecondaryUseDRAFT.pdf Kaplan, W., Wirtz, V. J., Mantel-Teeuwisse, A., Stokl, P., Duthey, B. and Laing, R. 2013. Priority Medicines for Europe and the World: 2013 Update. WHO, Geneva. Available at: http://www.who.int/medicines/areas/priority_medicines/MasterDocJune28_FINAL_Web.pdf?ua=1 Laurie, G., Ainsworth, J., Cunningham, J., Dobbs, C., Jones, K. H., Kalra, D., Lea, N. C. and Sethi, N. 2015. On moving targets and magic bullets: Can the UK lead the way with responsible data linkage for health research? International Journal of Medical Informatics, 84: 933-940. Lea, N.C. 2015. Design and Development of a Knowledge Modelling Approach to Govern the Use of Electronic Health Records for Research. Doctoral thesis, University of London. Mostert, M., Bredenoord, A. L., Biesaart, M. C. I. H. and van Delden, J. J. M. 2015. Big Data in medical research and EU data protection law: challenges to the consent or anonymise approach. European Journal of Human Genetics, doi:10.1038/ejhg.2015.239 Organisaton for Economic Cooperation and Development (OECD). 2013. Strengthening Health Information Infrastructure for Health Care Quality Governance: Good Practices, New Opportunities and Data Protection Challenges. OECD Publishing, Paris. Available at: http://www.oecd.org/publications/strengthening-health-information-infrastructure-for-health-care-quality-governance-9789264193505-en.htm OECD. 2015. Health Data Governance: Privacy, Monitoring and Research. OECD Publishing, Paris. Available at: http://www.oecd.org/fr/publications/health-data-governance-9789264244566-en.htm Pharmaceutical Research and Manufacturers of America (PhRMA)/European Federation of Pharmaceutical Industries and Associations (efpia). 2013. Principles for Responsible Clinical Trial Data Sharing. Available at: http://transparency.efpia.eu/uploads/Modules/Documents/data-sharing-prin-final.pdf

Page 28: Projet préliminaire de rapport du CIB sur « Big Data » et ...unesdoc.unesco.org/images/0024/002452/245256F.pdf · La numérisation de toutes sortes de données mène à un phénomène

- 28 -

Sethi, N. and Laurie, G. 2013. Delivering proportionate governance in the era of eHealth: making linkage and privacy work together. Med Law Int, 13: 168–204. United Nations General Assembly (UNGA). 1948. Universal Declaration of Human Rights. United Nations (UN), New York. Available at: http://www.un.org/en/universal-declaration-human-rights/index.html United Nations Educational, Scientific and Cultural Organization (UNESCO). 2005. Universal Declaration on Bioethics and Human Rights. UNESCO, Paris. Available at: http://portal.unesco.org/en/ev.php-URL_ID=31058&URL_DO=DO_TOPIC&URL_SECTION=201.html