L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde Industriel...

Preview:

DESCRIPTION

Présentation au ENMI 2013 : Entretiens du Nouveau Monde Industriel - Centre Pompidou.

Citation preview

!11

L’historien et l’algorithme !FREDERIC  KAPLAN  DIGITAL  HUMANITIES  LABORATORY

!21

Pourquoi s’intéresser aux sciences historiques ? !

!31

Parce qu’elles sont sur le point de subir un profond bouleversement. !

!41

Parce que leur importance est capitale, alors que les nouvelles technologies nous donnent l’impression de vivre dans un “grand maintenant”, sans passé, ni futur.

!51

La conquête du passé est la nouvelle frontière.

!61

Cette reflexion commence par une visite aux archives d’Etats de Venise.

!71

!81

80 km d’archives couvrant 1000 ans d’histoire !

!91

La mémoire du “Google” du moyen-âge. !

!101

Nous sommes face à des “Big data” du passé. !

!111

Comment transformer cette archive en un système d’information ? !

!121

Les archives constituent un objet trop gros pour être étudié par des équipes isolées de chercheurs. !

!131

Comme le système génomique !

!141

Comme le système cérébral !

!151

Comme le système planétaire !

!16

Comme  pour  le  Genome,  le  Cerveau  ou  la  Terre,  nous  avons  besoin  de  l’ac$on  coordonnée  d’un  grand  groupe  de  chercheurs  et  d’étudiants  pour  espérer  transformer  ce  mega-­‐objet  en  un  système  informaKonnel.  

!17

Comme  pour  le  Genome,  le  Cerveau  ou  la  Terre,  les  algorithmes  joueront  sans  doute  un  rôle  central  dans  ceNe  entreprise  collecKve.  

!18

«[...] l'historien de demain sera programmeur ou il ne sera plus ». !Emmanuel  Leroy  Ladurie  Le  Nouvel  Observateur,  1968

!19

Les relations houleuses qu’histoire et informatique entretiennent ne sont pas nouvelles. !

!20

Déjà,  des  la  fin  des  années  1960,  la  plupart  des  grandes  conférences  d’Histoire  incluaient  dans  leur  programme  des  tables  rondes  conflictuelles  opposant  les  «  nouveaux  »  historiens  aux  historiens  «  tradiKonnels  ».

Thomas  2004  “CompuKng  and  Historical  ImaginaKon”  in  A  companion  to  Digital  HumaniKes,  Blackwell

!21

Les  «  nouveaux  »  vantaient  les  mérites  de  gros  ordinateurs  pour  réaliser  des  calculs  à  grande  échelle.  Ils  défendaient  une  histoire  moins  narraKve,  appuyée  par  des  méthodes  quanKtaKves.  Le  terme  «  cliométrique  »  fut  forgé  durant  ceNe  période  pour  nommer  ceNe  nouvelle  manière  de  faire  l’histoire  avec  l’aide  des  grands  nombres.

!22

Le  camp  des  «  tradiKonnels  »  accueillait  ce  type  d’approches  avec  un  profond  scepKcisme.  

!23

« Toutes les questions importantes sont importantes précisément parce qu’elles ne peuvent recevoir de réponse quantitative ». !Robert  Swierenga,  1970  Quantification  in  American  History,  Atheneum.

!24

« Ce sont toujours les projets qui ont été financés avec le plus d’ampleur, ceux qui ont rassemblé des ambitieuses armées de chercheurs payés, ceux dont la science était la plus liée aux dernières technologies informatiques, ceux qui impliquaient les présentations mathématiques les plus sophistiquées, qui, au final, se sont révélées les plus décevantes » !Lawrence  Stone,  cité  par  Thomas  2004

!25

Des  décennies  ont  passé,  les  mêmes  débats  se  perpétuent.  Les  méthodes  quanKtaKves  ont  montré  leur  force  pour  certains  domaines  et  leur  manque  de  perKnence  pour  d’autres.  Il  n’y  a  pas  vraiment  eu  de  révoluKon.

!26

Il  y  a  dix  ans,  pourtant,  dans  un  arKcle  de  2004,  William  Thomas  III  notait  déjà  que  quelque  chose  de  plus  excitant  et  de  plus  dérangeant  que  les  premiers  projets  «cliométriques  »  était  en  train  de  se  consKtuer.  

!27

« Les historiens sont en train de construire des systèmes à grande échelle pour reconstituer les données historiques sous des formes géographiques pour divers lieux dans le monde (…). Considérés dans leur ensemble ces efforts ouvrent des possibilités remarquables pour reconstituer des ensembles intégrés et organisés en réseau » !William  Thomas,  Computing  and  Historical  Imagination,  2004

!28

« Ces modèles en quatre dimensions pourraient reconstituer les immeubles, les routes et les ruines des territoires historiques autant que les géographies légales, économiques, sociales ou religieuses qui leur sont associées. Les réseaux informationnels, financiers, commerciaux et culturels pourraient également trouver leur place dans ces modèles » !William  Thomas,  Computing  and  Historical  Imagination,  2004

!29

« Le rôle pour l’historien qui travaillera dans ce média numérique sera de rendre ces technologies informatiques transparentes » !William  Thomas,  Computing  and  Historical  Imagination,  2004

!30

En  dix  ans,  ce  tournant  cartographique  a  effecKvement  eu  lieu  avec  le  développement  des  systèmes  d’informaKon  géohistorique  (Historical  Geographical  InformaKon  Systems).  

!31

Mon  hypothèse  :    (1)  Ce  tournant  spa$al  est  en  fait  un  tournant  algorithmique  dans  la  mesure  où  il  impose  les  algorithmes  comme  nouveaux  médiateurs  des  sciences  historiques.    

!32

Mon  hypothèse  :    (2)  Une  nouvelle  généra$on  d’étudiants  sera  à  la  base  ceNe  grande  transformaKon.      

!33

Parce  que  nous  parlons  d’une  transformaKon  technique  et  généraKonnelle,  il  faut  replacer  ce  tournant  cartographique  propre  aux  sciences  historiques  dans  le  contexte  plus  large  de  nouvelles  interfaces  pour  l’explora$on  de  l’espace.  

!34

!35

!36

!37

Avec les interfaces d’exploration de l’espace, tout se passe comme si nous vivions dans un grand maintenant. Le temps a disparu.

!38

Peut-­‐on  construire  des  “Google  maps”  du  passé  ?  

!39

Peut-­‐on  construire  des  “Facebooks”  du  passé  ?  

!40

Peut-­‐on  reconstruire  numériquement  un  passé  aussi  dense  que  notre  présent  ?  

!41

!42

!43

!44

L’EPFL et l’université Ca’Foscari ont lancé cette année un projet intitulé la “Venice Time Machine” construit selon cette approche.

!45

Cette initiative regroupe aujourd’hui quelques dizaines de chercheurs et d’étudiants qui collaborent pour construire un modèle multidimensionnel de Venise.

!46

L’enjeu est de constituer une grande base de données, open access, dont chacun pourrait se sentir co-auteur. Faire de ce modèle de Venise un bien commun, collectivement construit.

!47

La stratégie de développement consiste à faire converger recherche et éducation en créant un programme de cours associé à ce programme de recherche.

!48

Nous expérimentions ce programme cette année avec 60 étudiants. L’objectif pour l’an prochain est d’ouvrir un cours en ligne pouvant être suivi par plusieurs dizaines de milliers d’étudiants simultanément.

!49

Comment numériser efficacement des archives aussi anciennes ?

!50

Pourrait-on numériser ces documents sans les ouvrir ?

!51

Comment transcrire les documents numérisés ?

!52

Comment adapter les techniques générales aux cas particuliers ?

!53

Comment extraire et coder les informations qu’ils contiennent ?

!54

Pourrait-on utiliser les techniques du “web sémantique” ?

!55

Connectées les unes aux autres, ces données forment un grand graphe.

!56

Ce graphe permet de poser des questions inédites. Quel est le salaire moyen d’un apprenti en 1622 ? Combien de fils de peintres sont eux-mêmes peintres ? Quels sont les procès qui ont impliqué des travailleurs du verre à Murano au XVIIe siècle ?

!57

Ce graphe peut aussi se deployer dans le temps et l’espace.

!58

1500

Les cartes du passé sont riches de détails.

!59

1550

!60

1572

!61

1576

!62

1765

!63

1829

Au XIXe siècle, les cartes changent.

!64

1859

!65

1910

!66

Reconstruire les Venise(s) du passé est comme résoudre un “Sudoku” géant

!67

Quand l’espace de solutions de ce Sudoku est trop grand, les algorithmes sont d’une grande aide.

!68

Ces reconstructions disparates sont intégrées dans des modèles spatiotemporels unifiés.

!69

!70

!71

!72

!73

!74

!75

!76

!77

!78

!79

900

La même logique est déployée à l’échelle des échanges méditerranéens.

!80

1000

!81

1100

!82

1200

!83

1300

!84

1400

!85

1500

!86Le trafic mois par mois peut être simulé

!87

En juin 1322, quel est le prochain bateau de Constantinople à Corfou ? Combien de temps prendra le voyage ? Quels sont les chances de rencontrer des pirates ?

!88

Pour tracer les routes, il faut transformer les hypothèses en algorithmes.

!89

La  quesKon  centrale  de  ce  programme  de  recherche  est  la  gesKon  et  la  représentaKon  des  incer$tudes  et  des  inconsistances.

!90

Trois  processus  renforcent  le  rôle  de  la  formalisaKon  et  les  algorithmes  dans  ce  contexte.      

!91

(1)  Ce  type  de  projets  demande  une  éthique  de  la  représenta$on  et  ceci  impose  un  certain  niveau  de  formalisa$on.  Il  faut  documenter  les  différents  regimes  d’incer$tude  qui  sous-­‐tendent  les  données  visualisées.    

!92

(2)  Le  besoin  d’interopérabilité  nécessaire  pour  la  consKtuKon  des  grandes  bases  de  données  conduit  à  définir  un  formalisme  permeNant  de  coder  non  seulement  l’informaKon  historique,  mais  la  meta-­‐informa$on  historique  (les  processus  intellectuels  et  techniques  qui  ont  conduit  aux  données).

!93

(3)  Les  cartographies  historiques  et  la  simulaKon  invitent  à  transformer  les  hypothèses  en  algorithmes.  Les  chercheurs  peuvent  aller  au  delà  du  débat  d’arguments,  en  opposant  dans  le  domaine  cartographique  leurs  hypothèses  appareillées  sous  la  forme  d’algorithmiques.

!94

Ces  trois  évoluKons  tendent  à  introduire  les  algorithmes  comme  nouveaux  médiateurs  des  sciences  historiques.    !

!95

Près  de  cinquante  ans  après  la  prédicKon  d’Emmanuel  Leroy  Ladurie,  il  faut  sans  doute  former  une  nouvelle  généra$on  d’étudiants  capables  de  maîtriser  les  algorithmes  comme  ouKls  de  connaissance  et  de  débats  mais  aussi  de  s’interroger  sur  ces  changements.

!96

En  rapprochant  recherche  et  éducaKon,  ceNe  nouvelle  généra$on  d’étudiants  va  non  seulement  bénéficier  de  ces  projets  de  grande  ampleur,  mais  jouer  un  rôle  crucial  dans  leur  succès  ou  leur  échec.  

!97

Il  s’agit  “simplement”  d’organiser,  chaque  année,  la  rencontre  entre  des  dizaines  de  milliers  d’étudiants  et  des  dizaines  de  milliers  de  documents.  

!98

Les  algorithmes  seront  les  médiateurs  de  ceNe  rencontre.  

!99125

dhlab.epfl.ch !frederic.kaplan@epfl.ch  @frederickaplan

Recommended