DE L’HUMAIN DANS LES MARCHES VIRTUELS
!1
Sihem Amer-Yahia Directrice de Recherche CNRS Laboratoire d’Informatique de Grenoble
Colloque les sciences de l’information en interaction avec l’humain Février 2019
Internet
Et l’humain apparut
Rôle des internautes
Les internautes consommateurs de contenu
Les internautes à la fois consommateurs et
producteurs
Les internautes deviennent employés travail = micro-tâches
Internautes consommateurs
Internautes consommateurs
Internautes producteurs
Que fait-on avec les tweets ?
New York sur
Etaveclesphotos?
!11
2.1
8.7
9.3
Algorithmes pour l’extraction automatique de contenus utiles des données du Web social
1. Pour la recommandation 2. Pour la prédiction 3. Pour la vérification d’hypothèses
Un grand nombre de mes travaux sont dans ce cadre : très gros volumes (Very Big Data), algorithmes distribués, index, applications diverses (Web social, données patients, données grande consommation)
Fouille de données du Web social
Internautes employés•Marchés de travail virtuels
•destinations pour chercher un travail temporaire
•destinations pour chercher de la main d’oeuvre
•Le crowdsourcing
•Le freelancing
platforme de crowdsourcing
micro-tâches
!14
Le crowdsourcing
employés
Classification de galaxies Galaxy Zoo
Annotation de tickets de caisse Amazon Mechanical Turk
Trouver une tâche
!17
!18
Algorithmes d’appariement tâches/employés
plateforme de freelancing
Micro-tâches
!19
Le freelancing
employés
Mondes virtuel/physique TaskRabbit
!20
!21
QAPA
!22
Discrimination (Droit)
• Traitement défavorable ou inégal, en comparaison à d’autres personnes ou d’autres situations égales ou similaires, fondé sur un motif expressément prohibé par la loi • 23 motifs dans le Code Pénal
!23
Comment se passe la sélection des individus pour une tâche ?
!24
motifs protégés par le Code Pénal
motifs calculés
Etude de la discrimination algorithmique sur les plateformes de travail virtuelles
•Quantifier et réparer la disparité dans le tri des individus
•Une approche bi-disciplinaire •les juristes ont besoin de comprendre les dérives
algorithmiques au regard du régime juridique •les informaticiens ont besoin de comprendre le
régime juridique applicable afin de tester le comportement de l’algorithme et identifier les risques de dérive algorithmique
• Travail en cours (CNRS MASTODONS et montage d’un GDR)
Pour résumer
• Les internautes sont des acteurs incontournables du Web
• Leur implication nécessite de les protéger contre les dérives algorithmiques
• Leur protection nécessite un rapprochement entre l’informatique et les sciences sociales (droit, psychologie, …)
• pour automatiser l’audit des algorithmes existants
• pour créer des algorithmes justes
• Et de développer une réglementation au delà des frontières physiques