7
15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier http://flaubert.univ-rouen.fr/revue/article.php?id=162 1/7 > Accueil / revue / revue n° 13 REVUE Contact | À propos du site Application de la plateforme philologique DINAH à deux projets d’éditions critiques PierreÉdouard Portier Maître de conférences en informatique à l’INSA de Lyon, LIRIS Voir [Résumé] Nous proposons une méthodologie pour modéliser un corpus de manuscrits en vue d'assister les chercheurs dans leur travail d'édition critique. Nous montrons en particulier que les moments de transitions entre différents types de structures documentaires abstraites représentent des opportunités pour affiner les structures utilisées pour modéliser l'archive. Ils permettent même parfois la correction d'erreurs de modélisation. Nous illustrons aussi comment l'union de deux modes d'accès aux structures documentaires créées, l'un favorisant plutôt une lecture diachronique, l'autre une vision synchronique, semble particulièrement convenir à un travail exploratoire sur l'archive. Nous illustrons l'approche au moyen de cas d'utilisations issus de deux projets d'éditions critiques : les dossiers de Bouvard et Pécuchet[1], et les archives de JeanToussaint Desanti[2]. Nous cherchons à vérifier l'hypothèse selon laquelle la détection des moments de transitions entre structures documentaires est favorable à un retour critique constructif sur les choix de modélisations qui ont jusquelà dirigé l'élaboration de l'archive. Une manière de permettre ces événements de transitions consiste à ordonner les types de structures utilisables des plus aux moins contraintes. Il faut décider d'une structure de base la plus contrainte, audessus de laquelle d'autres structures se construiront par affaiblissements et combinaisons. Nous n'innovons pas en choisissant une structure de liste : selon l'anthropologue Jack Goody, la liste apparaît avec les tout premiers systèmes d'écriture et constitue une forme d'écrit abondante dès 3000. […] elle « implique discontinuité et non continuité » […] [et] « elle fournit un dispositif spatial de triage de l'information »[3]. En fait, nous optons pour des listes typées, c'estàdire organisées en ensembles disjoints. De plus, deux listes quelconques d'un même ensemble ne peuvent pas contenir d'éléments identiques : les listes d'un ensemble sont ellesmêmes disjointes. Par référence aux travaux de T.H. Nelson, nous appelons ces ensembles de listes des dimensions[4]. Par ailleurs, nous appelons les listes d'une dimension ses segments. Enfin, nous appelons les éléments d'un segment ses fragments. Par exemple, dans le contexte des travaux sur les archives de Jean Toussaint Desanti, nous avons utilisé une dimension nommée d.archive pour représenter l'ordre des pages manuscrites au moment de la réception de l'archive et de sa numérisation. Chaque liste de la dimension d.archive correspond ainsi à un ensemble de pages qui se succédaient au sein de l'archive physique (e.g. les pages d'un cahier relié, ou bien des pages volantes regroupées dans une pochette, etc.). Voir la Figure 1 pour un exemple de présentation d'un segment de la dimension d.archive. Retour Sommaire Revue n° 13 Revue Flaubert , n° 13, 2013 | « Les dossiers documentaires de Bouvard et Pécuchet » : l’édition numérique du creuset flaubertien. Actes du colloque de Lyon, 7-9 mars 2012 Numéro dirigé par Stéphanie Dord-Crouslé Modélisation dimensionnelle d'une archive documentaire Œuvres Dossiers manuscrits Correspondance Ressources par œuvre Biographie Iconographie Bibliothèque Études critiques Bibliographie Thèses Comptes rendus Études pédagogiques Dérivés À l'étranger Revue Bulletin Questions / réponses Agenda Ventes Vient de paraître Sur la toile RECHERCHE

Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier

http://flaubert.univ-rouen.fr/revue/article.php?id=162 1/7

> Accueil / revue / revue n° 13

REVUE

Contact | À propos du site

Application de la plateforme philologique DINAH àdeux projets d’éditions critiques

PierreÉdouard PortierMaître de conférences en informatique à l’INSA de Lyon, LIRIS

Voir [Résumé]

Nous proposons une méthodologie pour modéliser un corpus demanuscrits en vue d'assister les chercheurs dans leur travail d'édition critique.Nous montrons en particulier que les moments de transitions entre différentstypes de structures documentaires abstraites représentent des opportunitéspour affiner les structures utilisées pour modéliser l'archive. Ils permettentmême parfois la correction d'erreurs de modélisation. Nous illustrons aussicomment l'union de deux modes d'accès aux structures documentaires créées,l'un favorisant plutôt une lecture diachronique, l'autre une visionsynchronique, semble particulièrement convenir à un travail exploratoire surl'archive. Nous illustrons l'approche au moyen de cas d'utilisations issus dedeux projets d'éditions critiques : les dossiers de Bouvard et Pécuchet[1], et lesarchives de JeanToussaint Desanti[2].

Nous cherchons à vérifier l'hypothèse selon laquelle la détection desmoments de transitions entre structures documentaires est favorable à unretour critique constructif sur les choix de modélisations qui ont jusquelàdirigé l'élaboration de l'archive. Une manière de permettre ces événements detransitions consiste à ordonner les types de structures utilisables des plus auxmoins contraintes. Il faut décider d'une structure de base la plus contrainte,audessus de laquelle d'autres structures se construiront par affaiblissementset combinaisons. Nous n'innovons pas en choisissant une structure de liste :selon l'anthropologue Jack Goody, la liste apparaît avec les tout premierssystèmes d'écriture et constitue une forme d'écrit abondante dès 3000. […]elle « implique discontinuité et non continuité » […] [et] « elle fournit undispositif spatial de triage de l'information »[3].

En fait, nous optons pour des listes typées, c'estàdire organisées enensembles disjoints. De plus, deux listes quelconques d'un même ensemble nepeuvent pas contenir d'éléments identiques : les listes d'un ensemble sontellesmêmes disjointes. Par référence aux travaux de T.H. Nelson, nousappelons ces ensembles de listes des dimensions[4]. Par ailleurs, nous appelonsles listes d'une dimension ses segments. Enfin, nous appelons les élémentsd'un segment ses fragments.

Par exemple, dans le contexte des travaux sur les archives de JeanToussaint Desanti, nous avons utilisé une dimension nommée d.archive pourreprésenter l'ordre des pages manuscrites au moment de la réception del'archive et de sa numérisation. Chaque liste de la dimension d.archivecorrespond ainsi à un ensemble de pages qui se succédaient au sein del'archive physique (e.g. les pages d'un cahier relié, ou bien des pages volantesregroupées dans une pochette, etc.). Voir la Figure 1 pour un exemple deprésentation d'un segment de la dimension d.archive.

Retour Sommaire Revue n° 13

Revue Flaubert, n° 13, 2013 | « Les dossiers documentaires deBouvard et Pécuchet » : l ’édition numérique du creusetflaubertien. Actes du col loque de Lyon, 7-9 mars 2012Numéro dirigé par Stéphanie Dord-Crouslé

Modélisation dimensionnelle d'une archive documentaire

Œuvres

Dossiers manuscrits

Correspondance

Ressources par œuvre

Biographie

Iconographie

Bibliothèque

Études critiques

Bibliographie

Thèses

Comptes rendus

Études pédagogiques

Dérivés

À l'étranger

Revue

Bulletin

Questions / réponses

AgendaVentesVient de paraîtreSur la toile

RECHERCHE

Page 2: Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier

http://flaubert.univ-rouen.fr/revue/article.php?id=162 2/7

Figure 1 : Exemple d'un segment de la dimension d.archive

Dans le cas de la dimension d.archive, la structure dimensionnelle estutilisée pour représenter un ordre partiel sur l'ensemble des pages manuscritesde l'archive. Elle peut aussi être utilisée pour représenter une relation binairequelconque. Il en est ainsi de la dimension d.transcription qui associe à unepage manuscrite sa transcription (voir Figure 2).

Figure 2 : Exemple d'un segment de la dimension d.transcription

Que les segments d'une dimension soient entre eux disjoints offre uneforme d'orthogonalité qui permet une projection naturelle de deux dimensionssur l'espace de l'écran. Soit l'exemple de la Figure 3 où sont projetéeshorizontalement la dimension d.archive et verticalement la dimensiond.transcription.

Figure 3 : Projection simultanée des dimensions d.archive etd.transcription

Souvent, une configuration dimensionnelle adhoc permettra de répondresimplement à un problème applicatif donné. Ainsi, la Figure 4 montre uneconfiguration dimensionnelle adaptée pour la transcription.

Figure 4 : Configuration dimensionnelle pour la transcription

Sur la partie haute de la Figure 4 sont projetées verticalement d.archiveet horizontalement d.transcription (i.e. une situation inverse à celle de laFigure 3). Nous remarquons que la présence verticale de d.archive n'est pasvisible : dans cette configuration la partie haute est volontairement réduite àune seule ligne. Cependant, avoir configuré verticalement d.archive est utileà la navigation au sein des pages transcrites d'une collection : il suffit dedéplacer le curseur vers le haut ou vers le bas pour passer d'une page à l'autre.

Page 3: Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier

http://flaubert.univ-rouen.fr/revue/article.php?id=162 3/7

Sur la partie basse de la Figure 4 se trouve une zone d'annotation associée àl'élément de transcription sur lequel se trouve le curseur (ici, une instance duconcept présent). La Figure 5 explique comment est construite cetteconfiguration pour l'annotation des éléments de transcription : les éléments detranscription annotés appartiennent à la dimension d.fragment, la relationbinaire pour l'annotation est modélisée par la dimension d.note.

Figure 5 : Projection des dimensions d.fragment et d.note

Les pages transcrites permettent en particulier des recherches sur lestextes du corpus. Or, le résultat d'une requête textuelle se modélisetrivialement par une dimension, ce qui permet de croiser les résultats d'unerecherche avec d'autres dimensions. Par exemple, la Figure 6 montre laprojection de la requête q.présent et de la dimension d.transcription.

Figure 6 : Projection des dimensions q.présent et d.transcription

Enfin, notons que la structure dimensionnelle renouvelle la métaphore dupressepapier. Nous créons une dimension d.clipboard telle que lorsque desfragments sont copiés, ils sont en fait ajoutés au premier segment de cettedimension. Ainsi, l'utilisateur peut naviguer au sein de l'archive et remplir unpanier avec des éléments qui seront éventuellement utilisés dans son travailcritique à venir.

Sur l'exemple de la représentation de la structure physique des collectionsd'une archive, nous montrons maintenant comment une modélisationdimensionnelle permet de représenter des structures arborescentes. Pourfonder solidement le réordonnancement critique d'une archive manuscrite, ilest nécessaire de représenter l'état d'intrication de l'archive au moment de sanumérisation. La Figure 7 montre une pochette qui provient du fonds JeanToussaint Desanti. Elle contient une série de pièces qui ellesmêmescontiennent d'autres pièces, etc.

Page 4: Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier

http://flaubert.univ-rouen.fr/revue/article.php?id=162 4/7

Figure 7 : Pochette du fonds JeanToussaint Desanti

Une telle arborescence peut se représenter au moyen de l'union de deuxdimensions. La première dimension est utilisée pour exprimer la relation « apour premier descendant », la seconde dimension est utilisée pour exprimer larelation « est au même niveau hiérarchique ». La Figure 8 illustre lareprésentation dimensionnelle d'une petite forêt[5].

Figure 8 : Représentation dimensionnelle d'une forêt

Ainsi, tout en restant dans un modèle dimensionnel, nous pouvonsproposer des vues arborescentes. Par exemple, la Figure 9 montre en haut unmoyen de naviguer au sein de la structure initiale de l'archive, et en bas uneinterface utilisée pour proposer des réordonnancements conjecturaux departies de l'archive.

Figure 9 : Représentation d'arborescences

Notons enfin que les fragments documentaires peuvent aussi comprendredes zones d'images de manuscrits. Voir sur la Figure 10 un exemple deconfiguration qui permet de naviguer parmi les zones qui ont été isolées sur lespages manuscrites des dossiers de Bouvard et Pécuchet.

Figure 10 : Navigation parmi les zones de pages manuscrites

La Figure 11 présente l'outil qui permet d'isoler des zones polygonales surune page de manuscrit. Ces zones deviennent des fragments à part entière.Cet outil permet de créer les zones visibles sur la Figure 10.

Figure 11 : Éditeur de zones polygonales

Nous illustrons maintenant l'importance des événements de rupture d'unecontrainte structurelle pour le suivi de la qualité d'une édition critique en coursde construction.

Les événements de rupture d'une contrainte structurelle

Page 5: Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier

http://flaubert.univ-rouen.fr/revue/article.php?id=162 5/7

Nous avons vu plus haut une manière de conjuguer deux dimensions pourreprésenter une arborescence, d'autres types de conjugaisons sontintéressants. Considérons par exemple les deux dimensions d.cite etd.reformule. Notons abεd.1 l'appartenance du segment formé des fragmentsa et b à la dimension d.1. Posons abεd.cite et bcεd.reformule. Autrementdit, le fragment a fait explicitement référence au fragment b qui est luimêmeune reformulation du fragment c. Si nous ne sommes intéressés que parl'organisation temporelle des fragments, d.cite et d.reformule sont alorsidentifiables, ce qui peut s'exprimer à travers la règle : d.postérieur = d.cite+ d.reformule. Ainsi, la dimension d.postérieur, construiteautomatiquement, permet d'oublier à propos de d.cite et d.reformule tout cequi ne concerne pas la relation temporelle (i.e. plus génériquement : l'ordrepartiel) impliquée.

Ce mécanisme permet de détecter des erreurs. Ainsi, supposons qu'unutilisateur tente de modifier bcεd.reformule en bcaεd.reformule. Alors, lesystème ne pourra pas reconstruire automatiquement d.postérieur, car lasituation abcaεd.postérieur est interdite (un fragment ne peut pasapparaître deux fois dans une même dimension). L'utilisateur est alors informéde l'erreur et peut la corriger.

Prenons comme second exemple les chevauchements qui peuvent avoirlieu entre fragments textuels annotés au sein d'une transcription (voir laFigure 12). Posons que l'ensemble des étiquettes utilisables pour annoter untexte soient organisées en ensembles disjoints appelés vocabulaires. Ajoutonsune contrainte structurelle : les étiquettes qui appartiennent à un mêmevocabulaire ne doivent pas introduire de chevauchements entre les fragmentstextuels qu'elles décorent. Ainsi, supposons que les étiquettes <line> et<citation> appartiennent initialement à un même vocabulaire. Suite àl'événement décrit par la Figure 12, il devient nécessaire de les classer dansdes vocabulaires distincts. Notons que notre système n'éprouve pas dedifficulté technique à représenter des chevauchements entre élémentsannotés. La structure de vocabulaire est introduite afin d'ajouter un niveau decontrôle sur la dynamique de la construction et de l'utilisation des étiquettes.

Figure 12 : Exemple d'un chevauchement entre fragments textuels annotés

Les deux exemples précédents illustraient l'intérêt de la notion de ruptured'une contrainte structurelle. Nous trouvons un point de vue similaire dans lestravaux de Valentin Turchin :

The conversion of language, occurring as a result of formalization, into areality independent of the human mind which creates it has farreachingconsequences. The justcreated language machine (theory), as a part of

Page 6: Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier

http://flaubert.univ-rouen.fr/revue/article.php?id=162 6/7

the human environment, becomes an object of study and description bymeans of the new language. In this way a metasystem transition takesplace. In relation to the described language the new language is ametalanguage and the theories formulated in this language and concernedwith theories in the languageobject are metatheories. If the metalanguageis formalized, it may in turn become an object of study by means of thelanguage of the next level and this metasystem transition can be repeatedwithout restriction[6].

Le mode de visualisation dimensionnel présenté jusqu'ici, résolumentdiachronique, ne permet pas facilement la construction rapide d'une imagementale d'un tissu de relations impliquant plus de deux dimensions. C'estpourquoi nous introduisons une vue dite « bureau du chercheur » qui permetde libérer l'utilisateur de la contrainte orthogonale imposée par une vuedimensionnelle (tout en perdant bien entendu les capacités de navigation quiaccompagne cette dernière). Ainsi, sur la Figure 13, nous voyons affichéessimultanément quatre dimensions. Sans trop entrer dans les détails, laconfiguration de la Figure 13 est une preuve de l'assertion : « Le manuscrit Aest un brouillon pour le manuscrit B », et remarquons en particulier, en hautde la capture d'écran, un lien réifié.

Figure 13 : Vue synchronique dite « bureau du chercheur »

La nécessité d'une articulation entre la vue « bureau du chercheur » et lavue dimensionnelle est apparue en particulier dans le contexte du projetBouvard. Dans ce projet, un travail sur l'archive, par exemple une analysethématique, commence le plus souvent par la constitution d'un panier quicomprend des fragments potentiellement utiles à la recherche initiée. Un telpanier se modélise naturellement comme une dimension. Il peut être construitmanuellement par un utilisateur qui navigue dans l'archive et sélectionne un àun les fragments lui semblant intéressants. Il peut aussi être le résultat d'unerequête (en effet, comme montré plus haut, le résultat d'une requête formeune dimension).

Une fois le panier constitué, certains de ses fragments peuvent être glisséssur le bureau afin de visualiser ce qui les lie dans l'archive (voir la Figure 14).Ensuite, de nouvelles relations peuvent être tissées, au moyen de la vuedimensionnelle ou bien de la vue bureau, afin de formaliser de nouvelleshypothèses (e.g. définir des stades génétiques, etc.).

Figure 14 : Interactions entre le panier et le bureau du chercheur

Notons enfin que les relations visibles entre les fragments disposés sur lebureau du chercheur représentent seulement un sousensemble de toutes lesrelations qui existent entre ces fragments. L'utilisateur choisit ce sousensemble en fonction des besoins de sa recherche.

Pour conclure, l'utilisation unifiée des vues dimensionnelle et « bureau du

chercheur » peut être une esquisse de solution au problème bien posé parGilbert Simondon :

[…] [au sujet de la dialectique platonicienne] ce modèle du savoir, quisuppose un réalisme épistémologique et un certain innéisme de laconnaissance des structures, prend surtout pour modèle la communicationvisuelle et l'ordre synchronique. Dans l'empirisme au contraire, leséléments de l'expérience sont porteurs d'information ; ils entrent encommunication les uns avec les autres dans le sujet qui les compare, les

Union d'une lecture dimensionnelle diachronique et d'une vue graphique synchronique

Page 7: Ressources par œuvre Correspondance REVUE ...flaubert.univ-rouen.fr/revue/revue13/documents/Gustave...Application de la plateforme philologique DINAH à deux projets d’éditions

15/3/2014 Gustave Flaubert - revue - revue n° 13 - article de Pierre-Édouard Portier

http://flaubert.univ-rouen.fr/revue/article.php?id=162 7/7

sélectionne, élimine et classe selon différentes méthodologies […] ils'organise un dialogue entre le sujet et son expérience, apportéeprogressivement de manière diachronique […] Kant a reconnu et situé leproblème de la communication interne, de la découverte et de l'invention ;mais ce problème n'a pas véritablement, jusqu'à ce jour, été élucidé.[…] l'étude de la communication externe fournit des modèles, mais desmodèles insuffisants, parce qu'ils sont dominés soit par le principe de lasynchronie, soit par celui de la diachronie ; or, ces deux principes ne sontpas compatibles entre eux, ne se laissent pas ramener à l'unité dans unsystème plus élevé qui conserverait toutes leurs propriétés[7].

[1] Voir http://www.dossiersflaubert.fr/.

[2] Voir http://institutdesanti.enslyon.fr/.

[3] Christian Vandendorpe, Du papyrus à l'hypertexte, Paris, La Découverte,1999, p. 127128. Disponible en ligne :http://vandendorpe.org/papyrus/PapyrusenLigne.pdf.

[4] Theodor Holm Nelson, « A cosmology for a different computer universe :Data model, mechanisms, virtual machine and visualization infrastructure »,Journal of Digital Information 5.1, 2006.

[5] Donald E. Knuth, Art of Computer Programming, Volume 1, Third Edition,Reading (Massachusetts), AddisonWesley, 1997, p. 334.

[6] Valentin Fedorovich Turchin, The phenomenon of science, New York,Columbia University Press, 1977, p. 210.

[7] Gilbert Simondon, Communication et information : cours et conférences,éd. Nathalie Simondon, préface JeanYves Chateau, Chatou, Éditions de latransparence, 2010, p. 131.

[Pour lire les fichiers PDF, téléchargez gratuitement Adobe Acrobat Reader]

NOTES

Mentions légales