28
Théorie de l'ingénierie des documents numériques Stéphane Crozat Contributions : Bruno Bachimont Ingénierie Documentaire http://doc.crzt.fr 14 septembre 2016

Théorie de l'ingénierie des documents numériques · auteur pour un lecteur. L'essence du numérique II Définition : Connaissance Définition : La connaissance inscrite ... documents

  • Upload
    lamthuy

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

  • Thorie de l'ingnierie des

    documents numriques

    Stphane Crozat

    Contributions: Bruno Bachimont

    Ingnierie Documentairehttp://doc.crzt.fr

    14 septembre 2016

  • Table des matires

    I - Introduction l'ingnierie documentaire 4

    1. Concept de document ................................................................................................................ 4

    2. Concept d'ingnierie documentaire ............................................................................................ 6

    II - L'essence du numrique 7

    1. Thorie du support et de la connaissance inscrite ............................................................... 7

    2. La raison computationnelle ........................................................................................................ 9

    3. a a t manipul! ................................................................................................................. 10

    III - Le document numrique entre signe et calcul 11

    1. Le paradigme logique ............................................................................................................... 11

    2. Le paradigme smiotique ......................................................................................................... 12

    3. Les limites du paradigme logique .......................................................................................... 13

    4. Les limites de l'approche smiotique ..................................................................................... 14

    5. Le paradigme documentaire ..................................................................................................... 15

    IV - Le principe du balisage documentaire 17

    1. Balises et poignes de calcul .................................................................................................. 17

    2. La structuration logique ........................................................................................................... 17

    3. Exemple de structuration logique ........................................................................................... 18

    V - Bibliographie 20

    VI - Complments 21

    VII - Exercices 22

    1. Questions thoriques ................................................................................................................. 23

    1.1. Exercice: ............................................................................................................................................................ 231.2. Exercice: ............................................................................................................................................................ 241.3. Exercice: ............................................................................................................................................................ 241.4. Exercice: Ingnierie des connaissances et des contenus (commentaire de texte) .................................. 241.5. Exercice: Document numrique, ingnierie documentaire et archivage. .................................................... 25

  • Abrviations 26

    Bibliographie 27

  • Introduction l'ingnierie documentaire

    4

    1. Concept de document

    Un document est une de sur un prenne, tablie dans un inscription contenus support contexte de et pour un .production contexte de rception

    Un contenu est une forme d'expression pourvue d'une valeur culturelle associe un vhicule matriel, il exprime une signification et suscite une rception et une interprtation.

    Une inscription est un contenu fix sur un , tel qu'il lui apporte une permanence support matrieldans le temps.

    Une dfinition donne oralement est un contenu.

    Une transmission hertzienne d'un flux audiovisuel est un contenu.

    Une dfinition crite est une inscription.

    Un enregistrement magntique d'une transmission hertzienne d'un flux audiovisuel est une inscription.

    Un glossaire de dfinitions publi sur un livret, par un chercheur pour sa communaut est un document.

    Une mission de tlvision, produite par une chane pour ses tlspectateurs, enregistre sur un support magntique est un document.

    Introduction l'ingnierie documentaire

    I

    Fondamental

    Dfinition: Contenu

    Dfinition: Inscription

    Exemple : Exemple de contenu

    Exemple : Exemple d'inscription

    Exemple : Exemple de document

  • Concept de document

    5

    -

    -

    -

    -

    -

    Contenu Forme d'expression

    Inscription Contenu + Permanence

    Document Inscription + Contexte

    Document = Contenu + Permanence + Inscription

    Notion de document

    Un document est pourvu de trois proprits fondamentales:

    : Un document est dlimit dans le temps et dans l'espace, il a un dbut et une La fermeturefin, l'on sait de quoi il est constitu (parties), il est scnaris (sa forme prescrit une ou plusieurs linarits explicites, qui se s'imposent ou se proposent au lecteur).

    : Un document est intentionnel, il est destin un usage, il nat d'une L'intentionnalitintention auctoriale et ditoriale, il est produit dans un contexte d'criture et publi pour un contexte de lecture.

    : Un document est publi, il est rendu public sous une forme matrielle donne La publicationet fige, son contexte de production et de diffusion est identifiable et objectivable.

    Le document est pourvu de deux facettes:

    C'est un considr pour ses proprits physique qui relve d'une manipulation objet techniquetechniqueC'est un considr pour sa signification qui relve d'une interprtationobjet culturel

    Reformulations

    Fondamental : Caractristiques du document

  • Concept d'ingnierie documentaire

    6

    Notons que les dfinitions prcdentes laissent de ct la notion de document comme objet dont l'intentionnalit est reconstruite , au sens o un objet archologique est un document a posterioripour l'archologue par exemple.

    2. Concept d'ingnierie documentaire

    L'objet de l'ingnierie documentaire est la conception de systmes techniques permettant et optimisant l'articulation de la manipulation technique et de l'interprtation culturelle des documents.

    L'ingnierie des documents numriques est le sous-ensemble de l'ingnierie documentaire, dont l'objet est la construction de systmes informatiques et qui ne considre que les documents dont le support est numrique.

    L'essence computationnelle du numrique fait que les documents qu'il supporte ont t , ce qui interroge thoriquement les proprits fondamentales du document (fermeture, manipuls

    intentionnalit, publication).

    La question de la manipulation informatique est donc au cur de l'ingnierie des documents numriques, qui s'attache d'une part optimiser ces potentialits manipulatoires et d'autre part protger en pratique les proprits fondamentales du document mises mal par le numrique.

    Remarque : Document "au sens large"

    Fondamental : Ingnierie documentaire

    Dfinition: Ingnierie des documents numriques

    Fondamental : Problmatique de l'ingnierie des documents numriques

  • L'essence du numrique

    7

    --

    -

    -

    1. Thorie du support et de la connaissance inscrite

    La thorie du support, est une thorie philosophique de la connaissance, issue notamment de la phnomnologie de , dveloppe notamment l'UTC travers des philosophes comme Husserl **

    Bernard Stielger ( , ) et Bruno Bachimont ( , ).1994a ** 1994b ** 1996 ** 2004 **

    Le concept gnral de la thorie du support est que toute connaissance ne peut procder que d'une inscription sur un support matriel.

    Cette ide est dveloppe en particulier autour du cas du support numrique.

    Une connaissance est la capacit d'exercer une action pour atteindre un but.

    Une connaissance pratique renvoie une activit dans le monde matriel (notion savoir-faire), elle est corrl un objet pratique (ce sur quoi porte l'action pratique).Une connaissance thorique renvoie la possibilit de produire ou reformuler des noncs dans un code de communication (notion de savoir), elle est corrle un objet matriel, mais pour ce qu'il reprsente et non pour ce qu'il est (par exemple de l'encre sur du papier).

    La connaissance pratique porte sur une modification physique du monde, la connaissance thorique porte sur une modification de notre reprsentation du monde.

    ( , pp65,67)Bachimont, 2004 **

    Toute connaissance repose sur une , dont elle est l'interprtation:inscription

    la connaissance est l'interprtation de l'inscriptionl'inscription est la matrialisation de la connaissance

    Ainsi un livre, une cassette vido ou un logiciel vhiculent des connaissances, sans les modliser au sens de la logique formelle ou de l' , mais en leur offrant un support de et de IA ** mmorisation

    .manifestation

    La transmission de connaissance rsulte de son inscription intentionnelle sur un support par un auteur pour un lecteur.

    L'essence du numrique II

    Dfinition: Connaissance

    Dfinition: La connaissance inscrite

  • Thorie du support et de la connaissance inscrite

    8

    ---

    --

    1.

    2.

    3.

    4.

    5.

    Le support technique devient alors une cognitive, un processus d'extriorisation, qui permet prothsel'anticipation et la constitution de modes nouveaux de reprsentation : par pro-thse nous entendrons toujours la fois : pos devant, ou spatialisation (-loignement); et pos d'avance, dj

    .l (pass) et anticipation (prvision), c'est dire temporalisation. ( )Stiegler, 1994 **

    Le support est donc un moyen de spatialiser l'information, pour la rejouer dans le temps.

    Le support est prendre au sens le plus large, pour soutenir une telle thse, il faut en effet largir la notion d'inscription tout ancrage matriel de la connaissance, et en particulier au corps:

    Une inscription est corporelle quand le support technique est le corpsUne inscription est externe quand le support est externe au corps

    ( , p255)Bachimont, 2007 **

    La signification de l'inscription est conditionne par les du support:proprits matrielles

    Le support impose un l'inscription car il ajoute de l'intelligibilit.supplmentSelon le type de support, le supplment d'intelligibilit sera diffrent.On aura donc une .rationalit spcifique par type de support

    La thorie du support s'articule autour de la thse centrale suivante :

    Les proprits du substrat physique d'inscription, et du format physique de l'inscription, conditionnent l'intelligibilit de l'inscription.

    Elle comprend en outre les thses suivantes :

    une connaissance est la capacit d'effectuer une action dans un but donn.un objet technique prescrit par sa structure matrielle des actions. L'objet technique est l'inscription matrielle d'une connaissance.toute connaissance procde d'une gense technique. Seule la rptition, prescrite par les objets techniques, de l'action permet d'engendrer la connaissance comme capacit exercer une action possible.la connaissance, engendre par la technique, prescrit une transformation dans le monde des choses (l'objet technique est alors un instrument) ou une explicitation dans le monde des reprsentations (l'objet technique est alors une inscription smiotique).

    Complment : Le support comme prothse

    Remarque

    Fondamental : Le supplment

    Complment : Les thses de la thorie du support

  • La raison computationnelle

    9

    5.

    6.

    une pense est une reformulation effectue par la conscience sur le support corporel qu'est le corps propre. Penser, c'est s'crire. Toute pense, comprise comme reformulation a pour cible de rcriture le corps propre, et comme origine, le corps propre ou une inscription externe quelconque.la conscience est un pur dynamisme intentionnel, source des r-critures considres comme des interprtations et non comme un mcanisme.

    ( , p77)Bachimont, 2004 **

    2. La raison computationnelle

    Goody nous montre que l'invention de l'criture a modifi les schmes de reprsentation de la connaissance, jusque l orale, donnant naissance une . Les raison graphique (Goody, 79) **documents papiers ont permis la reprsentation spatiale de l'information, en lui donnant une permanence dans le temps.

    Grce ces possibilits nouvelles d'inscription, de nouvelles connaissances ont pu natre de .l'mergence de reprsentations qui ne peuvent tre formules oralement

    Goody expose l'exemple du tableau ou de la liste qui permettent de mettre en relief des relations qui ne pourraient merger par la description orale du tableau ou de la liste.

    Soit par exemple la lecture orale suivante:

    Lire le contenu du tableau ci-aprs voix haute.

    [cf. Exemple d'nonc orale d'un tableau]

    Soit la reprsentation tabulaire de la mme information:

    Anne Chiffre d'affaire Bnfice

    2004 123.315 5.154

    2005 115.247 7.156

    2006 114.265 8.245

    2007 112.250 8.300

    La spatialisation permet de faire merger des connaissances nouvelles, par exemple le fait que le fait que la baisse du chiffre d'affaire est corrle une hausse des bnfices. Le changement de support a eu une influence sur la connaissance elle-mme.

    Dfinition: La raison graphique

    Exemple : Le tableau

  • a a t manipul!

    10

    Un autre exemple est celui des mathmatiques, qui n'existeraient pas sans criture.

    Le passage de l'oral l'crit n'est donc pas seulement un changement de support, c'est une rvolution cognitive.

    De mme que l'crit a permis le passage du temporel au spatial par projection de la parole, le support numrique apporte de nouvelles formes de reprsentation des informations, bases sur le calcul. Bachimont parle de l'mergence d'une ( ).raison computationnelle Bachimont, 2004 **

    En effet l'ordinateur ne traite que des squences binaires qui, par le calcul, deviennent des signes sur un support tel que l'cran. C'est cette proprit du support numrique qui est fondamentale en tant qu'elle propose de nouvelles modalits d'inscription. Et ces nouvelles modalits induisent galement la constitution de modes de reprsentation nouveaux, comme les tableaux pour la raison graphique en leur temps (Bachimont cite par exemple la couche, le rseau, etc.).

    L'enjeu est alors de comprendre inscrire les informations sur ce support spcifique qu'est le commentnumrique afin de reprer les structures d'inscription nouvelles pertinentes.

    3. a a t manipul!

    Bachimont ( , p33-34) propose de caractriser le du numrique (en rfrence 2007 ** nome Roland Barthes propos de la photographie: ), c'est dire a a t ce qu'il faut comprendre et

    , comme: .penser propos du numrique a a t manipul

    C'est dire que tout contenu numrique rsulte toujours d'une construction dynamique via un calcul. Lorsque je frappe sur mon clavier un calcul transforme mon action en codage binaire et en stockage d'information dans la mmoire de l'ordinateur. Lorsque je regarde mon cran, je vois le rsultat d'un calcul effectu sur le codage binaire partir de la mmoire.

    Exemple : Les mathmatiques

    Fondamental : Changer de support c'est changer de raisonnement

    Dfinition: La raison computationnelle

    Fondamental : Enjeu

  • Le document numrique entre signe et calcul

    11

    -

    1. Le paradigme logique

    Le positivisme logique est un courant de pense fond par le Cercle de Vienne (un groupe de philosophes et logiciens anim par Moritz Schlick entre 1929 et 1936).

    Il pose que toute connaissance est formelle et donc se rapporte une expression logique (au sens de la logique mathmatique) .(Soulez, 1986) **

    La machine de Turing, invent en 1936 par Allan Turing ( partir des travaux de Hilbert et Gdel), est un modle abstrait d'une machine universelle permettant d'automatiser tout calcul symbolique (alors que l'ordinateur n'existe pas encore).

    Elle montre que toute formalisation logique est calculable par une machine.

    https://interstices.info/jcms/nn_72391/comment-fonctionne-une-machine-de-turing

    L' est fonde en aot 1956, au Dartmouth College, lors d'un sminaire organis par Mac Carthy IA **et auquel sont prsents des figures telles que Simon, Newell, Minsky ou Shannon.

    Elle se construit sur un concept de modlisation (reprsentations logiques des problmes traiter) et d'effectivit (les reprsentations sont calculables).

    Le mouvement de l'IA (dite forte) a pour hypothse qu'un ordinateur peut penser puisque la connaissance est formalisable et que le formalis est calculable par une machine de Turing.

    Les langages de reprsentation des connaissances

    Le document numrique entre signe et calcul

    III

    Le positivisme logique

    La calculabilit

    Complment : Exemple de machine de Turing

    L'intelligence artificielle

    Complment : Exemples de ralisations clbres de l'IA

    https://interstices.info/jcms/nn_72391/comment-fonctionne-une-machine-de-turing

  • Le paradigme smiotique

    12

    ---

    -

    -

    -LISP en 1958 par John Mac CarthyLes systmes expertsDENDRAL en 1965 par Edward FeigenbaumLe traitement automatique de la langue naturelleELIZA en 1966 par Joseph WeizanbaumLa robotiqueSHRDLU en 1970 par Terry Winograd

    Le paradigme logique considre les inscriptions numriques en tant que formalisations de la connaissance.

    L'ordinateur calcule sur la connaissance formalise.

    1 Est-un (Voiture, Vhicule)2 Possede (Voiture, Roue, 4)3 Est-un (Ferrari, Voiture)

    Un ordinateur pourra calculer (dduire ?) qu'une Ferrari est un vhicule et qu'il possde quatre roues.

    2. Le paradigme smiotique

    La numrisation d'un contenu correspond son codage (donc un calcul) de tel faon que l'on soit capable par un dcodage (un autre calcul) de le restituer .tel qu'il a t cod

    Un tel traitement correspond une , car le contenu est inscrit mais non numrisation de la formeformalis (au sens de l' ).IA **

    Stiegler parle d'orthothtie pour exprimer la correspondance exacte entre information code et information dcode .(Stiegler, 1994) **

    Le numrique par essence n'est pas orthothtique, le calcul l'empche, mais elle peut tre restitue par un dispositif qui la simule (principe du ).WYSIWYG **

    ScannerTraitement de texteetc.

    Fondamental : Hypothse du paradigme logique

    Exemple : Formalisation logique de connaissances

    Numrisation

    Orthothtie

    Exemple : Exemple de systmes numriques smiotiques

    Est-un (Voiture, Vhicule)Possede (Voiture, Roue, 4)Est-un (Ferrari, Voiture)

  • Les limites du paradigme logique

    13

    -

    Le paradigme logique considre les inscriptions numriques en tant que simple numrisation de formes smiotiques.

    L'humain interprte ce qu'il peroit.

    Une est un vhicule quatre roues.voiture

    : Une Ferrari est une voitureExemple

    Un humain pourra dduire qu'une Ferrari est un vhicule et qu'il possde quatre roues. Un ordinateur ne peut que prsenter cette information, il n'accde pas au contenu.

    3. Les limites du paradigme logique

    L'hypothse du positivisme logique qui fonde l'IA, savoir que la connaissance est formelle et n'est que formelle, se rvle impossible tenir. Il n'est pas possible de formaliser logiquement l'ensemble des connaissances humaines et l'intelligence humaine ne peut tre rduite une manipulation de symboles sans signification.

    L'IA comme projet de cration de machines pensantes est remis en cause .(Winograd et Flores, 1989) **

    Les annes 1980 voient alors la naissance d'une IA modeste (ou ), dont l'objet n'est plus la faible construction de machines qui pensent, mais de (machines qui donnent penser

    ).Bachimont, 1996 **

    Parmi les programmes les plus ambitieux et les plus stratgiques de l'IA, celui de la traduction automatique, largement financ par la dfense amricaine en priode de guerre froide, avait pour terrain d'application la traduction anglais-russe. Une illustration mythique d'chec de ce programme tait le test de traduction de la phrase : ( The spirit is strong, but the flesh is weak l'esprit est

    ) qui donna aprs traduction automatique en russe, puis de nouveau en fort mais la chair est faibleanglais : ( The vodka is good, but the meat is rotten la vodka est forte, mais la viande est

    ).avarie

    Au del de son caractre amusant cet exemple illustre trs bien l'aporie d'une informatique symbolique qui bute sur des concepts de base tels que le contexte, la polysmie, etc.

    Fondamental : Hypothse du paradigme smiotique

    Exemple : Prsentation smiotique de contenu

    L'aporie de l'IA

    Des machines qui pensent aux machines qui donnent penser

    Exemple : Traduction automatique

  • Les limites de l'approche smiotique

    14

    Gdel montre en 1931 que les mathmatiques ne peuvent tre rduite la logique. Un corollaire direct est qu'il existe des connaissances qui ne sont pas reprsentables par la logique.

    Notons que Turing a galement dmontr que certains problmes sont indcidables par une machine de Turing (sans pour autant que cela remette en cause sa vision positiviste).

    L'ordinateur ne pense pas car il n'accde par au sens, ainsi que l'illustre Searle avec la mtaphore de la "chambre chinoise" : Un oprateur qui recevrait des idogrammes chinois et disposerait de procdures de traitement adapt ces signes pourrait excuter des oprations correctes, par application stricte des procdures (algorithmes). Pour autant cet oprateur ne comprendrait pas le chinois.

    Ainsi, raliser automatiquement des actions au sens d'une machine de Turing n'est pas penser.

    La reprsentation formelle des connaissances a donn des rsultats oprationnels tout fait satisfaisant (par exemple certains systmes experts), tant que cette reprsentation et que les raisonnements qui la concerne restent local un domaine, en particulier technique (mdecine par exemple).

    C'est la formalisation globale du monde qui est aportique.

    4. Les limites de l'approche smiotique

    Parce que le contenu numrique est toujours calcul ( ), ce que l'on lit n'est il a t manipul jamais ce qui a t crit.

    L'approche consistant a simuler une orthothticit masque le fonctionnement rel de la machine. Si les algorithmes sont suffisamment robustes cela n'aura pas de consquence pratique, mais si au contraire une faille s'immisce cela entrane l'incomprhension de l'utilisateur.

    Si l'usage du support numrique reste limit au codage et dcodage orthothtique de l'information, les potentialits du calcul, le propre du numrique, sont sous-utilises.

    Complment : Thorme d'incompltude de Gdel

    Complment : La chambre chinoise de Searle

    Complment : Reprsentations locales versus reprsentation globale

    L'enregistrement orthothtique numrique est impossible

    La simulation de l'enregistrement orthothtique est une falsification

    C'est une sous-utilisation de l'informatique

  • Le paradigme documentaire

    15

    Une approche exclusivement smiotique quivaudrait au champ fonctionnel d'une photocopieuse, sans la certitude de la conformit de la copie l'original fournie par la photocopieuse.

    La question se pose donc de l'oprationnalisation, au sens du calcul, de connaissances en langue naturelle : Comment manipuler par des algorithmes des informations codes orthothtiquement ?

    [...] le formalisme comme principe de modlisation n'est plus tenable. En revanche, le formalisme comme principe d'effectivit reste indispensable (Bachimont 1996) **

    L'enjeu est donc d' le codage orthtique pour lui ajouter des proprits qui seront enrichirexploitables par le calcul.

    Bachimont parle d'informatisation, comme tat suprieur de la numrisation, du point de vue de la manipulation calculatoire .(Bachimont, 2004) **

    L'impossibilit de l'enregistrement orthothtique et le calcul comme principe de manipulation conduisent une perte de (in-vrifiabilit thorique de ce que suis je en train de lire) avec rfrencecomme consquence potentielle la dsorientation du lecteur. Une informatique documentaire se doit donc de prendre acte de cet tat de fait pour l'intgrer dans sa rflexion et ses instrumentations.

    5. Le paradigme documentaire

    Le support numrique est un , permettant de mmoriser et de restituer de outil smiotiquel'information moyennant un .calcul

    Une approche uniquement calculatoire butte sur les limites de la formalisation en tant que principe de reprsentation de la connaissance et une approche uniquement smiotique butte sur la nature mme du support qui est le calcul. D'o la ncessit de coupler les deux.

    Une informatique documentaire consiste associer une dimension spatio-temporelle, l'inscription smiotique de contenus, et une dimension calculatoire, le modle de manipulation de ces inscriptions. Le support numrique n'a plus vocation modliser la connaissance, il a vocation la vhiculer, et l'objectif d'une informatique documentaire est de concevoir des modles qui optimisent ce vhicule.

    Le paradigme documentaire propose une description calculable d'inscriptions smiotiques. Il s'agit d'un compromis entre la formalisation logique du sens et l'enregistrement smiotique de la forme.

    L'ordinateur calcule sur les descriptions formelles pour dcider des modalits de prsentation des inscriptions, et l'humain interprte le rsultat prsent qu'il peroit.

    Exemple : Photocopieuse numrique

    Complment : De la numrisation l'informatisation

    Complment : La dsorientation

    Coupler enregistrement smiotique et modlisation logique

    Fondamental : Hypothse du paradigme documentaire

  • Le paradigme documentaire

    16

    1 2 Une voiture est un vhicule quatre roues.3 4 5 Une Ferrari est une voiture.6

    L'ordinateur peut rpondre une requte telle que "Je voudrais une dfinition de la notion voiture" en prsentant l'information:

    Une est un vhicule quatre roues.voiture

    Il n'a aucune ide de ce qu'est une voiture, mais il permet l'humain de le savoir en calculant une prsentation adquat du contenu qui vhicule cette connaissance.

    Exemple

    Une voiture est un vhicule quatre roues.

    Une Ferrari est une voiture.

  • Le principe du balisage documentaire

    17

    --

    -

    -

    1. Balises et poignes de calcul

    L'ingnierie documentaire met profit deux thses complmentaires :

    le contenu est numris dans sa forme signifiante : il est manipulable par la machine mais indpendamment du sa signification qui lui reste inaccessible ;le contenu est enrichi par des balises qui sont connues syntaxiquement et smantiquement par la machine ; elle sait quoi en faire.

    Le principe du balisage consiste enrichir un contenu numris (dans sa forme smiotique), sans l'altrer, pour lui ajouter des poignes qui vont tre manipulables par l'ordinateur (logiquement).

    Le contenu est donc interprtable par l'homme et la machine, chacun via ce qui lui est destin :

    l'humain interprte le contenu signifiant numris ;la machine interprte les balises ;

    XML est une illustration de ce principe, puisque l'on va coupler une information smiotique (texte, image, etc.) destine l'interprtation humaine, avec un ensemble de balises qui permettent de dcrire formellement une structure documentaire qui sera alors manipulable par le calcul.

    2. La structuration logique

    Un document peut tre dcrit comme une collection d'objets comportant des objets de plus haut niveau composs d'objets plus primitifs. Les relations entre ces objets reprsentent les relations logiques entre les composants du

    Le principe du balisage documentaire IV

    Fondamental

    Remarque

    Exemple : XML

  • Exemple de structuration logique

    18

    document. Par exemple [...] un livre est divis en chapitres, chaque chapitre en sections, sous-sections, paragraphes, etc. Une telle organisation documentaire est appele reprsentation de . (traduit document structurdepuis la prface de )Structured documents **

    On appelle structuration logique d'un contenu une inscription explicitant la structure de ce contenu en fonction de son organisation et des attributs intrinsques qui le caractrisent et non en fonction de proprits de prsentation sur un support.

    Un document dcrit par sa structure logique est appel document abstrait, on parle aussi de .document structur

    On appelle structuration physique ou mise en forme d'un contenu une inscription dcrivant la faon dont ce contenu doit tre prsent sur un support donn.

    Un document dcrit par sa structure physique est appel document format, c'est en gnral galement ce dont on parle quand on parle simplement de document.

    Il est possible de calculer une ou plusieurs structurations physiques pour une mme structuration logique. Il est possible de calculer d'autant plus de structurations physiques que la structuration logique est indpendante de ses supports de prsentation.

    La structuration logique est associe au fond du contenu, tandis que la structuration physique est associe sa forme sur un support.

    Langages XML orient documents (cf. p.)

    3. Exemple de structuration logique

    Soit la structuration logique d'un exercice :

    1 Exercice = {Enonce, Question, Indice, Solution}

    Dfinition: Structuration logique

    Dfinition: Document abstrait

    Dfinition: Structuration physique

    Dfinition: Document format

    Remarque

    Remarque

    Complment : Voir aussi

    Exemple : Un exercice structur logiquement

    Exercice = {Enonce, Question, Indice, Solution}

  • Exemple de structuration logique

    19

    2 avec 3 Enonce = Soit un triangle rectangle disposant d'un angle de 30 degrs. 4 Question = Donner la valeur des autres angles du triangle.5 Indice = La somme des angles d'un triangle est gale 180 degrs.6 Solution = 90 et 60 degrs.

    Il est possible partir de cette reprsentation de calculer diffrentes prsentations. Pour l'cran on peut gnrer une prsentation HTML, en laissant la solution en hyperlien cliquable. Pour le papier on peut gnrer une prsentation PDF, en affichant la solution sur une page spare de l'nonc. Pour un usage multimdia on pourra gnrer une prsentation SMIL, avec affichage de l'nonc, lecture de la question, et affichage de la solution aprs un temps de pause.

    Notons que si l'on avait choisi une des reprsentations physiques, plutt que la reprsentation logique, il n'aurait pas t possible de gnrer les autres reprsentations.

    Soit la mise en forme en HTML du mme exercice :

    1 2 3 Soit un triangle rectangle disposant d'un angle de 30 degrs. 4 Donner la valeur des autres angles du triangle. 5 Vous avez besoin d'aide ? 6 Vrifier votre rponse ! 7 8

    On voit que dans ce format la structure logique n'apparat plus explicitement et qu'il n'est plus possible d'identifier l'nonc, la question et la solution sans comprendre le contenu.

    L'exemple montre que l'on peut calculer la mise en forme partir de la structure logique, mais non l'inverse.

    Exemple : Un exercice mis en forme

    Fondamental

    avec Enonce = Soit un triangle rectangle disposant d'un angle de 30 degrs. Question = Donner la valeur des autres angles du triangle. Indice = La somme des angles d'un triangle est gale 180 degrs. Solution = 90 et 60 degrs.

    Soit un triangle rectangle disposant d'un angle de 30 degrs. Donner la valeur des autres angles du triangle. Vous avez besoin d'aide ? Vrifier votre rponse !

  • Bibliographie

    20

    -

    --

    --

    1. 2. 3.

    Ingnierie des connaissances et des contenus (Bachimont) **

    Chapitre 1, 8, 9, 10, 11

    Document : forme, signe et mdium, les re-formulations du numrique **

    Le texte en jeu : Permanence et transformations du document **

    Document et modernits, troisime texte **

    Hermneutique matrielle et artfacture **Arts et sciences du numrique : ingnierie des connaissances et critique de la raison computationnelle**

    Instrumentation numrique des documents : pour une sparation fonds/forme **

    Rinterroger les structures documentaires : de la numrisation l'informatisation **

    Numrique et ingnierie documentaire

    BibliographieV

    Complment : Ouvrage de rfrence

    Complment : Roger T. Pdauque

    Complment : Autres textes de Bachimont

    Complment : Autre texte li

    http://www4.utc.fr/~nf29/DOCS/lug

  • Complments

    21

    -- Prservation culturelle et numrique (B. Bachimont)

    Numrique et ingnierie documentaire (L. Gaillard)

    ComplmentsVI

    http://nf29.crzt.fr/contribs/Bachimont2013_Preservation-culturelle-numeriquehttp://nf29.crzt.fr/contribs/Gaillard2008_Numerique-et-ingenierie-documentaire

  • Exercices

    22

    ExercicesVII

  • Exercice:

    23

    1. Questions thoriques1.1. Exercice:

    [60 minutes]

    Chaque question sera traite sur une demi-page environ. Vous mobiliserez vos connaissances thoriques (concepts cls du cours) ainsi que pratiques (exemples concrets). Vous veillerez particulirement la prcision de vos noncs et ne pas effectuer de contre-sens ou d'erreur majeure. La qualit gnrale de la rdaction (et de l'orthographe) sera prise en compte.

    Question 1

    Question 2

    Question 3

    Question 4

    -

    -

    --

    Pourquoi peut-on dire que la sparation entre le fond et la forme est un principe thoriquement faux, bien que mobilis dans les chanes ditoriales XML ?

    Indice :

    La connaissance n'existe qu'inscrite, donc il n'existe pas de fond indpendant d'une formeLes chanes ditoriales ne font que simuler ce principe, en favoriser une forme qui serait plus proche du "fond" - en fait de l'intention auctoriale - et plus loigne de la mise en forme.C'est un principe de rationalit, cela permet d'accder certaines proprits intressantes pour l'ingnierie du contenu (rutilisation, multi-supports, etc.)Exemple: en pratique il est difficile d'crire tout indpendamment d'une forme pour un auteur par exemple, l'aller-retour entre forme d'criture et forme de publication est souvent ncessaire.

    Expliquer le principe d'une chane ditoriale XML base sur la sparation entre un format de stockage orient mtier (fond) et des formats de mise en forme orients prsentation (forme).

    Pourquoi doit-on se poser la question de savoir si un document numrique est encore un document ?

    En quoi le principe du balisage est-il un lment de rponse la problmatique de l'ingnierie des documents numriques ?

  • Exercice:

    24

    1.2. Exercice:[90 minutes]

    Pour chaque question, vous produirez un argumentaire en deux ou trois pages maximum. Vous mobiliserez les concepts vus en cours, dans les ouvrages de rfrence, et dans vos propres lectures complmentaires. Vous veillerez un usage prcis des termes employs, et la rigueur de l'argumentaire: Vous avez un espace d'expression limit, il convient de le "rentabiliser" au mieux en ne produisant que des noncs dignes d'intrt pour le lecteur - ou, en clair, vitez le remplissage et l'utilisation approximative de notions mal matrises!

    Question 1

    Question 2

    1.3. Exercice:[15 minutes]

    En quoi peut-on rapprocher l'indexation de l'opration de balisage que l'on peut effectuer sur un document? Ont-elles la mme finalit? Utilisent-elles les mmes outils? Peut-on dire que l'une est une partie de l'autre? Un moyen pour l'autre?

    1.4. Exercice: Ingnierie des connaissances et des contenus (commentaire de texte)[30 min]

    Le document numrique [...] n'est pas rellement un document au sens o le document papier en est un. Le document numrique est proprement parler un complexe documentaire compos de ressources enregistres, d'un dispositif de reconstruction du contenu pour l'afficher dans une forme perceptible et intelligible, et finalement des vues reconstruites. Aucune de ces composantes ne peut prtendre elle seule d'tre le document, ni mme un document, en supposant que les composantes soient elles-mmes des documents intervenant dans la construction d'un autre. En effet, la ressource est persistante car elle est enregistre sur un support prenne. Mais elle n'est pas consultable telle quelle sans la mdiation d'un dispositif technique de lecture. Autrement dit, sans ce dispositif, la ressource reste inintelligible et imperceptible. Mais la vue reconstruite n'est pas davantage un document : si

    Quelles diffrences peut-on relever entre un document et une base de donnes ? Peut-on les exploiter de la mme manire ? Contiennent-ils le mme type d'information ? On reviendra pour cela sur les types de contenus, les formats et les exploitations que l'on peut en faire.

    Est-ce qu'un auteur a pleinement sa place au sein des chanes ditoriales XML ? Peut-on anticiper des difficults leur mise en uvre et donc dduire des recommandations pratiques pour l'organisation du travail et l'accompagnement des usages ? Quels seraient les mtiers proches, dans le monde classique de l'dition et de la presse par exemple, du rle attendu de l'auteur dans la chane ditoriale ?

  • Exercice: Document numrique, ingnierie documentaire et archivage.

    25

    -

    --

    elle est bien intelligible, elle n'est en gnral pas persistante, car elle ne dure que le temps de la reconstruction (affichage l'cran, restitution sonore). Enfin, le dispositif n'est pas davantage le document mme s'il contient un paramtrage permettant de configurer la ressource pour tre consulte.

    Dans ces conditions, le contenu affich rsulte autant de la ressource numrique que du paramtrage li au format d'enregistrement et au dispositif de lecture. La paternit du contenu est en quelque sorte rpartie entre la ressource et les conditions sous lesquelles la consulter au moyen du paramtrage adquat du dispositif de lecture.

    Mais cette distance introduite entre la vue reconstruite et la ressource enregistre a pour consquence que la reconstruction de la vue peut mobiliser diffrentes ressources, diffrents fragments d'origines diverses : il n'y a pas de relation intrinsque entre la vue consulte et la ressource prserve, sinon la confiance que l'on a dans le dcodeur. Autrement dit, le contenu consult possde de lui-mme une nature composite et la tendance technique propre au numrique ne peut que distendre encore ce lien entre la vue et la ressource pour rendre la vue encore plus anonyme, issue d'une reconstruction parse et diversifie.

    (Bachimont B., Ingnierie des connaissances et des contenus, Lavoisier, 2007, pp223-224)

    Question

    1.5. Exercice: Document numrique, ingnierie documentaire et archivage.En quoi la prservation des documents numriques interroge-t-elle la nature des documents numriques; et quel son rapport avec l'ingnierie documentaire?

    Mobilisez les contenus que vous avez tudis dans le cadre de l'UV:

    Bachimont B. (2007). Ingnierie des connaissances et des contenus. Hermes.Bachimont B. (2012). Archivage et prservation numrique. Cours de NF29 du 19 dcembre 2012, UTC.Crozat S. (2012). Chanes ditoriales et rditorialisation de contenus numriques. In "Le document numrique l'heure du web de donnes", coord. L. Calderan. ADBS ditions.

    Commentez ce texte.

    Vous prendrez soin d'expliquer le point de vue de l'auteur en le remettant dans son contexte. Vous mettrez en perspective ses hypothses en expliquant leurs consquences pratiques ; vous vous appuierez cet effet sur un ou plusieurs exemples concrets.

    La rigueur de la rdaction et du vocabulaire utilis sera pris en compte.

  • Signification des abrviations

    26Stphane Crozat (Contributions: Bruno Bachimont)

    IA : Intelligence Artificielle

    WYSIWYG : What You See Is What You Get

    Abrviations

  • Bibliographie

    27Stphane Crozat (Contributions: Bruno Bachimont)

    Jacques Andr, Richard Furuta, Vincent Quint, , Structured documents Cambridge University , 1989.Press

    , Bachimont Bruno Arts et sciences du numrique : ingnierie des connaissances et critique de la , Mmoire de HDR, , .raison computationnelle Universit de Technologie de Compigne 2004

    , , Bruno Bachimont Stphane Crozat Instrumentation numrique des documents : pour une , , . [sparation fonds/forme revue I3, vol 4, num 1 2004 http://archivesic.ccsd.cnrs.fr/sic_00001017.

    ]html

    , Bruno Bachimont Ingnierie des connaissances et des contenus: le numrique entre ontologies et , , documents Lavoisier, Herms 2007

    , , Thse en pistmologie, .Bachimont Bruno Hermneutique matrielle et artfacture 1996

    Stphane Crozat, , Bruno Bachimont Rinterroger les structures documentaires : de la , , . [numrisation l'informatisation revue I3, vol 4, num 1 2004 http://archivesic.ccsd.cnrs.

    ]fr/sic_00001015.html

    , , , Goody Jack La raison graphique : La domestication de la pense sauvage Les ditions de minuit.1979

    , , , (Ideen I, 1913).Husserl Edmund Ides directrices pour une phnomnologie Gallimard 1950

    Roger T. Pdauque, , Document : forme, signe et mdium, les re-formulations du numrique, . [ ]premier texte 2003 http://archivesic.ccsd.cnrs.fr/sic_00000511

    Roger T. Pdauque, , , Le texte en jeu : Permanence et transformations du document second texte. [ ]2005 http://archivesic.ccsd.cnrs.fr/sic_00001401

    Roger T. Pdauque, , , . [Document et modernits troisime texte 2006 http://archivesic.ccsd.cnrs.]fr/sic_00001741

    , , , Soulez Antonia Manifeste du Cercle de Vienne et autres rcits Presses Universitaires de France.1985

    Bibliographie

    http://archivesic.ccsd.cnrs.fr/sic_00001017.htmlhttp://archivesic.ccsd.cnrs.fr/sic_00001017.htmlhttp://archivesic.ccsd.cnrs.fr/sic_00001015.htmlhttp://archivesic.ccsd.cnrs.fr/sic_00001015.htmlhttp://archivesic.ccsd.cnrs.fr/sic_00000511http://archivesic.ccsd.cnrs.fr/sic_00001401http://archivesic.ccsd.cnrs.fr/sic_00001741http://archivesic.ccsd.cnrs.fr/sic_00001741

  • Bibliographie

    28Stphane Crozat (Contributions: Bruno Bachimont)

    , , , .Stiegler Bernard La technique et le temps, Tome I : La faute d'pimthe Galile 1994

    , , , .Stiegler Bernard La technique et le temps, Tome II : La dsorientation Galile 1994

    , , ,Winograd Terry Flores Fernando L'intelligence artificielle en question Presses Universitaires de , .France 1989

    Introduction l'ingnierie documentaireConcept de documentConcept d'ingnierie documentaire

    L'essence du numriqueThorie du support et de la connaissance inscriteLa raison computationnellea a t manipul!

    Le document numrique entre signe et calculLe paradigme logiqueLe paradigme smiotiqueLes limites du paradigme logiqueLes limites de l'approche smiotiqueLe paradigme documentaire

    Le principe du balisage documentaireBalises et poignes de calculLa structuration logiqueExemple de structuration logique

    BibliographieComplmentsExercicesQuestions thoriquesExercice:Exercice:Exercice:Exercice: Ingnierie des connaissances et des contenus (commentaire de texte)Exercice: Document numrique, ingnierie documentaire et archivage.

    AbrviationsBibliographie