examenscorriges.org · Web viewBUREAUTIQUE. Un monde centré sur le document. Ph. BERTRAND (C) V1.1.1 1998. Chapitre 1: Un objet méconnu, le papier 6. 1.1. La Bureautique en …

BUREAUTIQUEUn monde centré sur le document

Ph. BERTRAND

(C) V1.1.1 1998

CHAPITRE 1: UN OBJET MÉCONNU, LE PAPIER..................................6

1.1. La Bureautique en quelques mots........................................................6

1.2. Un objet apparemment simple : le papier............................................7

1.2.1. Papier et document électronique............................................7

1.2.2. La densité de stockage...........................................................8

1.2.3. Un support bi-dimensionnel...................................................8

1.2.4. Lisibilité, archivage, annotation.............................................9

1.2.5. Le papier comme outil de structuration des échanges............9

1.2.6. Reproduction et message lié au médium lui-même..............10

1.2.7. Quelques problèmes de la représentation électronique.........10

1.2.8. En conclusion......................................................................12

1.3. La lente évolution des représentations électroniques.........................12

1.3.1. Les premières transmissions électroniques...........................12

1.3.2. La situation jusqu’au début de l’informatisation..................12

1.3.3. L’apport des grands ordinateurs centraux............................14

1.3.4. L’arrivée des minis et le PARC...........................................14

1.3.5. L’émergence des réseaux informatiques..............................17

1.3.6. L’arrivée des PCs................................................................18

1.3.7. Les grandes études bureautiques..........................................19

1.3.8. Les incertitudes du début des années 1990 et Unix..............20

1.3.9. Le triomphe du PC et la domination de Microsoft...............21

CHAPITRE 2: UN OBJET COMPLEXE, LE DOCUMENT......................23

2.1. Qu’est ce qu’un document ?..............................................................23

2.2. Bases et définition d’un document....................................................26

2.3. Conversion de représentation, richesse et appauvrissement...............27

2.4. Passage d’une représentation de document à une autre......................31

2.5. Propriétés des documents riches et des documents pauvres...............34

2.6. D’autres documents que les documents textuels................................372

2.7. Représentation objet et documents multimédias................................38

CHAPITRE 3: QUELQUES REPRÉSENTATIONS DE DOCUMENTS. . .42

3.1. Les représentations intéressantes.......................................................42

3.2. Une représentation orientée vers la restitution : Postscript.................43

3.3. Polices de caractère...........................................................................47

3.4. HTML............................................................................................... 49

3.5. ODA ou la recherche du format universel.........................................51

3.5.1. Un objectif ambitieux..........................................................51

3.5.2. Les principes de base...........................................................52

3.5.3. La représentation de la structure logique d’un document.....53

3.5.4. Les blocs, entre la description logique et la description physique..............................................................................54

3.5.5. La structure physique du document.....................................54

3.5.6. Les difficultés liées à l’universalité de la norme..................55

3.5.7. Les raisons de l’échec..........................................................56

3.5.8. ODA et les classes...............................................................56

3.5.9. La réduction du nombre de traitements de texte...................56

3.6. SGML, XML et XSL........................................................................57

3.6.1. La standardisation des représentations riches.......................57

3.6.2. Le SGML............................................................................60

3.6.3. XML et XSL.......................................................................63

CHAPITRE 4: QUELQUES TYPES DE DOCUMENTS ET LEURS OUTILS 67

4.1. Les classiques: le traitement de texte et les outils de dessin...............67

4.2. Le tableur.......................................................................................... 70

4.3. La structuration de plusieurs documents............................................74

4.4. Décomposition d'un document en bloc..............................................76

4.5. Le document comme interface à des bases de données structurées....78

3

4.6. Formulaires et agendas......................................................................80

4.7. Des documents programmes..............................................................82

4.8. Sécurité et signature..........................................................................83

CHAPITRE 5: LE DOCUMENT DANS L'ESPACE ET DANS LE TEMPS90

5.1. Les possibilités du document électronique........................................90

5.2. Le courrier électronique....................................................................92

5.3. Répertoire.........................................................................................97

5.4. Les bases de données documentaires...............................................100

5.5. Les systèmes d'archivage.................................................................104

5.6. Circulation de documents................................................................108

5.7. Internet, intranet, extranet...............................................................112

5.7.1. La révolution WEB............................................................112

5.7.2. INTERNET.......................................................................113

5.7.3. Intranet..............................................................................113

5.7.4. Extranet.............................................................................115

5.8. Architecture bureautique.................................................................115

CHAPITRE 6: INTÉGRATION DE LA BUREAUTIQUE DANS L'ORGANISATION.................................................................................119

6.1. L'entreprise classique orientée "papier" et la bureautique................119

6.1.1. Introduction du traitement de texte....................................119

6.1.2. Introduction du courrier électronique.................................120

6.1.3. Enregistrement et archivage...............................................123

6.2. Quand l'électronique devient la référence........................................123

6.2.1. Les principes.....................................................................123

6.2.2. L'organisation du stockage.................................................124

6.2.3. Les outils d'acquisition et de restitution.............................125

6.3. Achat des produits bureautiques......................................................127

6.4. L'organisation de la bureautique......................................................1284

6.5. La gestion financière.......................................................................129

6.5.1. Les coûts bureautiques.......................................................129

6.5.2. Coût en matériel................................................................130

6.5.3. Ressources humaines.........................................................132

6.5.4. Total Cost of Ownership et amortissement des PC.............133

6.5.5. La facturation interne.........................................................135

CHAPITRE 7: QUELQUES PRÉCISIONS TECHNIQUES.....................137

7.1. Quelques notions concernant l'infrastructure réseaux......................137

7.2. Les protocoles "peer to peer", "client-serveur" et réplication..........138

7.3. Les approches objet.........................................................................140

7.4. Les techniques de base d'intégration du monde windows................143

7.5. OLE et l'approche composant sous windows...................................147

7.6. Java, javascript et la complexité du monde WEB............................150

1.1. La Bureautique en quelques mots

La bureautique, c'est l'informatique qui s'applique à la production, le transport, le stockage et l'impression d'un document. Une définition assez simple et qui ne semble pas nécessiter un livre pour en traiter tous les aspects. Après tout, si on en supprime l'aspect informatique, n'est ce pas que l'on fait avec le papier depuis l'invention de l'écriture il y a quelques millénaires ?

Aussi, à priori, il semble que la bureautique doive se confiner à décrire la façon de représenter le papier sous une forme électronique de 'bits' et de 'bytes', à transporter ces 'bits' et ces 'bytes' d'un point à l'autre, à les stocker et à les reproduire en fin de la 'chaîne bureautique' sur écran ou sur papier. Un livre de bureautique devrait être assez technique, peu excitant et en tout cas fort terre à terre...

5

Chapitre 1: Un objet méconnu, le papier

Mais si la réalité était telle, pourquoi la sortie d'un nouveau traitement de texte (ou d'une nouvelle version d'un traitement de texte existant) reste-t-elle un événement majeur ? Pourquoi la création d'un nouveau produit bureautique tel qu'un tableur a-t-elle pu faire en son temps la fortune d'une firme ou d'un individu ? Pourquoi l'arrivée de nouveaux standards de représentation de texte tel que le HTML et son émergence sur les grands réseaux télématiques (INTERNET) a-t-elle été saluée comme une révolution industrielle à ranger parmi les 'catalyseurs d'un changement de paradigme de société' pour reprendre un jargon un peu ésotérique mais au contenu assez correct ? Et finalement, pourquoi l'informatique, qui pendant 15 ans, a été synonyme de développement d'applications ciblées sur un domaine précis a-t-elle soudain prise une voie assez différente avec l'émergence de produits standards à intégrer entre eux, un peu comme si on était passé du stade de construction artisanale de 'pièces uniques' à une fabrication en grande série d'objets identiques ?

Si on analyse la définition de la bureautique, celle-ci ne parait, de prime abord ne receler aucun mystère. Produire, transporter, stocker et imprimer... Des mots simples, centenaires qui s'appliquent à des techniques connues...

De prime abord, un document semble aussi être un concept assez clair. Un document, un papier quoi... quelque chose qu’il est possible de lire.... enfin plus exactement, il est possible de lire ce qui est écrit sur le papier.... écrit avec de l'encre... lire les caractères du document... ou les dessins... oui c'est cela lire les textes... et les comprendre.... enfin s'ils sont écrits dans votre langue.... et si c'est un domaine que vous pouvez comprendre, dans lequel vous avez certaines bases....

En fait, un document n'est pas un concept simple. Sous ce nom se cache une représentation physique (originellement du papier et de l'encre) et une représentation d'un contenu avec tout ce que cela comprend habituellement comme couche empilée de règles, syntactiques tout d'abord puis de plus en plus sémantiques jusqu'à impliquer finalement tout l'environnement culturel du lecteur.

C'est à cause de cette complexité que la bureautique est complexe, est imaginative et créatrice. C'est parce qu'une image digitalisée est un document. Un texte écrit au moyen d'un traitement de texte est un document. Un ensemble de textes liés ensemble par des 'hyperliens' est aussi un (et plusieurs) documents. Un tableur est un document, un agenda électronique est un document, un formulaire électronique est un document et à la limite l'interface à une base de donnée centralisée est aussi un document. Un système de traduction automatique traduit des documents. Un système de reconnaissance de caractère convertit des documents en d'autres documents. Des documents peuvent être contenus dans d'autres documents. Des documents peuvent être des modèles et définir des règles pour créer d'autres documents. Et finalement un roman, un document de quelques centaines de pages, doit-il être vu comme un amas de pulpe de bois spécialement traité et recouvert d'extraits végétaux ou animaux appelés « encre » ou doit-il être défini comme une « super base de données », peut-être un peu plus complexe qu'une base de donnée relationnelle, mais répondant à des principes similaires de modélisation ?

6

Ces considérations peuvent paraître un peu abstraites. Elles ne le sont pas. C'est à cause de la difficulté de définir ce qu'est un document, c'est à cause des multiples niveaux auxquels le concept de 'document' peut être examiné que la bureautique est difficile à maîtriser et perpétuellement en évolution. C'est à cause de cette complexité aussi qu'il est difficile d'expliquer à un utilisateur pourquoi le texte qu'il reçoit par FAX ne peut pas être facilement stocké dans une base de donnée, pourquoi un tableau dans un tableur n'a pas les mêmes propriétés qu'un tableau représenté par une tabulation classique ou pourquoi, bien qu'ils semblent similaires à l'impression, un document peut être utilisé pour charger une base de donnée relationnelle alors que son frère jumeau doit être entièrement réencodé. La bureautique est proche de l'information, elle est proche de la notion d'entropie, une notion difficile à comprendre correctement. C'est à une meilleure compréhension des concepts qu'elle met en œuvre que ce livre est consacré.

1.2. Un objet apparemment simple : le papier

1.2.1. Papier et document électronique

Avant d'examiner les représentations électroniques des documents, il est bon d'examiner le concept de document papier que nos pères ont créé il y a quelques milliers d'années, d'abord au départ de roseaux en Egypte, puis à partir d'écorce de bois...

Un papier en fait est un support extraordinaire...

1.2.2. La densité de stockage

Tout d'abord c'est un système de stockage d'une densité incroyable. Il est fréquent de s'extasier sur la densité d'information que l'on peut écrire sur un CD-ROM voire sur une simple disquette et de la comparer avec le volume que prendrait la même information même écrite sur du papier bible. La comparaison n'est pourtant pas si simple. D'abord parce qu'un CD-ROM ou une disquette ne peut s'utiliser qu'avec un instrument de lecture qui est, lui, fort encombrant (et réclame de l'énergie électrique). Et ensuite parce qu'un CD-ROM ou une disquette n'est vraiment à son avantage que lorsqu'il s'agit de représenter des informations qui sont bien structurées comme du texte pur. Pour une représentation d'images de très haute définition par exemple, le papier, ce support à deux dimensions dans un monde à trois dimensions garde assez bien d’avantage. Actuellement, cependant, l’apparition de techniques de compression de plus en plus sophistiquées et l’utilisation de support de stockage de plus en plus dense (DVD-ROM, micro disques durs) permettent d’avoir des densités de représentation plus fortes dans les représentations électroniques. Néanmoins, le papier reste un bon moyen de communication de l'information. Etant souple et léger, il peut facilement être transporté à faible coût en grosse quantité.

1.2.3. Un support bi-dimensionnel

Le caractère bi-dimensionnel du papier lui donne aussi des propriétés extraordinaires comme celle de pouvoir être déposé dans une boîte aux lettres (où l'espace libre en dessous d'une porte), c-à-d dans un endroit où le déposant peut placer le document mais ni lui, ni une autre personne que le destinataire ne peut le reprendre.

7

Grâce à son caractère quasiment bi-dimensionnel, le papier peut aussi être glissé dans des enveloppes scellées qui en préservent la confidentialité ou plus exactement qui permettent normalement de détecter à l'arrivée si la confidentialité a été respectée. C’est une propriété difficile à reproduire par d'autres moyens de communication et qui est fort importante. Ainsi, une conversation téléphonique 'en clair' peut être écoutée par un tiers bien équipé intervenant sur le trajet de l'échange téléphonique. Cette écoute peut se faire pratiquement sans laisser de trace. Si la conversation est encryptée par celui qui parle et décryptée par celui qui écoute, il n'y par contre aucun moyen pour un tiers d'en connaître le contenu. L'enveloppe scellée est plus subtile. Elle permet d'intercepter le message... mais pas sans laisser de trace. Elle oblige donc l'indiscret à estimer le prix du secret, à valider aussi que le fait que le secret soit brisé et que cela soit connu ne retire pas par définition toute valeur à l'information.

1.2.4. Lisibilité, archivage, annotation

Le papier est lisible sans instrument et inscriptible avec des instruments rudimentaires faciles à avoir en permanence sur soi, peu coûteux et qui ne réclament pas d'autre énergie que l'énergie humaine... Le papier peut donc être utilisé facilement, même en l'absence d'infrastructure. Mais cela signifie aussi que le papier est un bon support d'archivage. Comme il ne réclame pas d'outil de lecture, il n'est pas à craindre que dans 10 ans, dans 100 ans ou dans 1000 ans, il ne soit impossible de reconstruire à un coût raisonnable une machine de relecture. D'autre part, parce qu'il est facile à lire, il permet une identification rapide du contenu. D'un seul coup d’œil, il est donc possible de distinguer une facture d'électricité d'un poème de Baudelaire.

Le support papier est résistant et l'information écrite avec des encres de bonne qualité peut être préservée pendant quelques siècles. D'autre part, ce support peut être plié ce qui permet de l'ajuster facilement à l'espace physique disponible. Lorsque le support est détruit correctement, il est possible de garantir la disparition de l'information qu'il contenait. Ce support (et son contenu) peut être découpé en morceau et rassemblé.

Le papier peut être facilement annoté. Comme il est très facile de le faire circuler, un papier enrichi d'annotation peut supporter le travail en groupe. Couplée avec la signature, l'annotation permet aussi de définir des procédures administratives formalisées enregistrant comment un problème répétitif doit être traité. Une forme particulière d'annotation et de signature est l'apposition d'un cachet qui peut servir à effectuer une signature 'rapide' mais aussi à d'autres fins (l'oblitération des timbres par exemple). A noter aussi des annotations très particulières du papier dans certains cas, tel la coutume des garçons de café de fait de déchirer partiellement le ticket après que le client aie réglé sa consommation (une sorte de signature en fait car on peut supposer que le garçon de café peut distinguer 'sa' façon de déchirer d'une imitation d'un client peu scrupuleux).

8

1.2.5. Le papier comme outil de structuration des échanges

Le papier se prête bien à la création de formulaires. Ces formulaires permettent de structurer l'information que l'on recherche à acquérir. La combinaison de formulaires pré-imprimés, de copies carbone et la signature manuelle a été pendant un siècle la façon traditionnelle de garantir un accord entre plusieurs parties, chacune de ces parties possédant une preuve pratiquement irréfutable de l'accord. Et même aujourd'hui, à l'heure où la plupart des magasins sont reliés par liaison téléphonique à des ordinateurs de validation, la signature d'un papier auto-copiant reste la façon la plus courante d'effectuer un paiement au moyen d'une carte de crédit.

Le papier permet de résoudre assez facilement le problème d’authentification des documents. D'une part, il est très difficile pour un tiers de modifier le contenu d'un papier sans laisser des traces de son travail. D'autre part, grâce à l'unicité de la signature, il est difficile pour l'auteur d'une signature de la réfuter par la suite. Ces deux caractéristiques, qui permettent de garantir l'authenticité d'un texte, sont à la base de l'utilisation du papier dans tous les documents officiels et toutes les transactions commerciales.

Ce support se prête bien aussi à une structuration hiérarchique. Au moyen d’agrafes permanentes, d’attaches trombone, de punaises, de colle, de papier collant, de perforation, d’une reliure, le papier peut être assemblé en dossier, livre, encyclopédie ou bibliothèque. Un livre peut être feuilleté, un dossier survolé en utilisant la puissance d'accès qu'offre la possibilité d'accéder en trois dimensions à un objet bi-dimensionnel. Les tablettes d'argiles qui ont précédé ce médium ne se prêtaient pas si bien ni à la structuration ni à un accès aussi rapide...

1.2.6. Reproduction et message lié au médium lui-même

Le papier est facilement reproductible. Hormis pour leur caractère d'authentification (et la possibilité d'avoir des copies de couleur différente si faciles à distinguer d'un seul coup d’œil dans une pile), les copies carbones ont presque disparu. La photocopieuse, une invention de XEROX (une firme dont il sera souvent question dans ce livre) a permis la grande diffusion d'informations ponctuelles. Bien évidemment, l'imprimerie, 400 ans auparavant, avait révolutionné la transmission de l'information en créant un outil de reproduction permettant des diffusions massives à faible coût. A noter que la photocopie permet en général de distinguer la copie de l'original. Plus généralement, il est possible d'assurer différents 'niveaux' de copie, avec une identification claire de la hiérarchie de copie. Ainsi, une université va imprimer (reproduire) en centaines d'exemplaires le formulaire de base utilisé pour créer les diplômes qu'elle délivre. Une photocopie d'un diplôme n'en reste pas moins très facile à distinguer de son original. En principe aussi, la photocopie d'un billet de banque est facile à distinguer de l'original…

9

Le papier est un support très riche. D'une part, il supporte une grande variété de représentation, comme le texte, les dessins ou les images de type photographique. Il peut revêtir des aspects très différents et se prêter à la projection à de larges audiences sur des panneaux ou via des techniques de projections (diapositives, transparents utilisés par rétro-projection). Le support est lui-même signifiant ; un rapport annuel de société, sur papier glacé polychrome, ne véhicule pas la même image qu'un 'médium' annonçant ses capacités à faire venir l'amour, l'argent et le bonheur sur une feuille volante photocopiée déposée dans une boîte aux lettres. Et une lettre d'amour touchée par son (sa) bien-aimé(e) a souvent plus de valeur que le même texte envoyé par INTERNET.

Certains types de supports spécialisés sont d'autre part extraordinaires puisqu'ils peuvent en une fraction de secondes, capter en parallèle une image couleur. De façon générale d'ailleurs, le parallélisme de traitement que permet une feuille de papier est largement exploité que ce soit dans l'imprimerie, la photographie ou la xérographie.

1.2.7. Quelques problèmes de la représentation électronique

Tout cela parait évident. Pourtant, chacune de ces propriétés est importante et son absence ou la difficulté parfois de la simuler dans un environnement informatique, pose souvent des difficultés presque insurmontables dans le domaine bureautique.

La densité d'information par exemple... En laissant de coté la question de la densité du support de stockage, il est clair que l'informatique est particulièrement faible pour représenter visuellement un document. Même un écran de 1024 sur 1024 est pauvre comparé à la richesse d'une page correctement imprimée (et que dire de la comparaison entre un 'bureau électronique' sur un tel écran par rapport à un ensemble de feuilles plus ou moins rangées sur un vrai bureau du monde réel). A cause de ce problème, de la fatigue visuelle liée à la consultation d'un écran, du volume d'un écran et de l'absence de manipulation tridimensionnelle, la lecture d'un document se fait encore aujourd'hui (et se fera encore pendant de nombreuses années) essentiellement sur papier.

L'informatique est aussi particulièrement faible pour transporter de façon électronique un volume d'information correspondant au papier. Bien sûr le délai de transport peut être plus faible par les moyens électroniques et une structuration adéquate du contenu permet de réduire très fort la quantité d'information à transporter. Mais le débit (throughput) moyen du transport par papier est de plusieurs ordres de grandeur plus important que celui du transport électronique avec les réseaux télématiques existants. Et les utilisateurs réguliers d'INTERNET savent que la liaison télématique est excellente pour avoir rapidement une quantité limitée d'information mais exécrable lors qu'il s'agit de rapatrier quelques images à haute définition...

10

Les problèmes d'authentification et de confidentialité sont bien compris dans le monde électronique et des solutions existent. Mais ces solutions sont beaucoup plus lourdes et complexes que la simple signature manuscrite. En plus, elles exigent d'être patiemment expliquées afin que leurs utilisateurs se convainquent de leur fiabilité. Elles ne sont pas non plus aussi souples que les techniques papier et les avatars du chips 'Clipper' aux Etats-Unis il y a quelques années, ou les règles complexes et souvent absurdes qui régissent la diffusion des algorithmes de cryptographie montre que dans ce domaine, la représentation électronique pose des problèmes spécifiques que ne pose pas la représentation «papier».

Bien sûr, la reproduction d'une représentation électronique est très facile. Tellement facile même, qu'il est difficile de protéger un document contre la copie illégale. Cette reproduction est anonyme et le document recopié est absolument identique à l'original. Par contre, la plupart des recopiages informatiques sont "séries" et non "parallèles" conduisant à des temps de reproduction prohibitifs pour des copies en très grande série. Ce n'est qu'avec l'avènement du CD-ROM que l'industrie électronique a résolu ce problème.

Le CD-ROM a aussi contribué à résoudre le problème de longévité des enregistrements. Les média magnétiques n'ont en effet pas une longévité importante et ils doivent être recopiés tous les 10 ans. A condition de trouver un équipement capable de relire les anciens formats... Par contre, parfois, ces médiums magnétiques ont trop de mémoire... les destructions d'information sont en effet très souvent 'logiques' et non 'physiques', ce qui veut dire qu'il est possible en analysant un disque dur d'un PC de retrouver des traces de documents compromettant pourtant détruits...

Le problème de volatilité des mémoires électronique est aussi bien connu, qu'il s'agisse du document électronique perdu à cause d'un crash disque, d'un «bug» du traitement de texte, d'une panne de courant ou d'une fausse manœuvre (comme l'écrasement d'une information par une autre, suite à une méprise).

Quant à la représentation simultanée d'objets différents tels que le texte ou les photos sur un même support, ce n'est que récemment que la représentation électronique a pris définitivement l'avantage sur le papier au prix d'une complexité assez impressionnante.

1.2.8. En conclusion

Bien entendu, le support électronique a des propriétés fabuleuses qui expliquent sa popularité croissante, mais ce chapitre montre bien les obstacles qui sont sur la voie d’un bureau «sans papier». Certains de ces obstacles, en particulier ceux relatifs à la taille et à la fidélité des moyens d'imagerie (écrans, imprimantes) ou ceux liés aux capacités en terme de bande passante des réseaux télématiques sont encore là pour longtemps...

11

1.3. La lente évolution des représentations électroniques

1.3.1. Les premières transmissions électroniques

La première transmission électronique (ou plus exactement électrique) d'information a eu lieu au milieu du XIXème siècle, avec l'invention du télégraphe électrique. Avant cela, des systèmes de transmission optique avaient été mis au point (télégraphe optique). Ceux-ci nécessitaient des opérateurs humains à chaque relais, opérateurs lents et sujets à erreur. Le télégraphe électrique et son code, le code Morse, optimisé pour permettre une transmission rapide, permettait une transmission presque instantanée (une fois les circuits établis) sur de grandes distances...

A la fin du XIXème siècle, apparut le téléphone, en fait la version analogique de ce système digital qu'était le télégraphe. Et comme tout système analogique (jusqu'à une époque récente), il permettait d'effectuer une meilleure balance entre la fidélité de la transmission et l'utilisation de la bande passante. Dès le début du XXème siècle, on songea à utiliser le téléphone pour transmettre des documents, avec l'invention du Bélinographe, l'ancêtre du FAX. Mais, la faible précision des capteurs de lumière, la difficulté de synchroniser parfaitement émetteur et récepteur et surtout l'absence de standards internationaux rendirent cette invention une simple curiosité pendant plusieurs dizaines d'années.

1.3.2. La situation jusqu’au début de l’informatisation

Pendant des années, jusqu'à la fin de la seconde guerre mondiale, la bureautique comme telle n'existe pas et les techniques de bureau restent figées pendant près de 50 ans.

Après la 2ème guerre mondiale, une étape importante est franchie, non pas grâce à une évolution technique soudaine mais simplement comme résultat de la mise sur pied d'une organisation nouvelle ; cette étape est l'invention du TELEX. Basé essentiellement sur le même principe que le télégraphe, le TELEX permet l'envoi de documents contenant un jeu de caractères très limité. Cette transmission est instantanée et surtout elle a une valeur légale, les machines TELEX étant construites pour être les seules à pouvoir émettre et recevoir des messages et les authentifiant de façon indélébile. Cette authentification est liée au terminal TELEX qui garde une trace des envois et des réceptions. En enfermant le terminal TELEX dans une enceinte contrôlée, on peut s'assurer que seules les personnes autorisées possèdent la signature de société que celui-ci représente. On s'assure aussi que le courrier entrant, nécessairement important puisque pouvant engager une société pour des montants importants (ou susceptible d'être utilisé lors de conflit contractuel) suit un chemin correct au sein de l'entreprise. Le réseau TELEX, qui est maintenant souvent remplacé par le FAX ou des réseaux plus spécialisés (transfert de fond) comptait environ 1.500.000 abonnés dans le monde dans le milieu des années 80 dont 150.000 abonnés en FRANCE.

12

C'est bien sûr à cette époque aussi qu'est inventé cette 'machine à tout faire' qu'est l'ordinateur. Mais bien entendu, en 1944, il sert plus à calculer les trajectoires que doivent utiliser les obus émis par un canon anti-aérien pour atteindre une cible mobile rapide (comme un avion) que pour taper une invitation à un cocktail mondain...

... et le MTBF (Mean Time Between Failure) de ces premiers ordinateurs n'est que de 10 minutes.

Pourtant, déjà à cette époque, un visionnaire, Vanover BUSH, décrit l'utilisation de l'ordinateur comme outil pour gérer un bureau, à une époque où les plus optimistes prévoient que 5 ou 6 ordinateurs seront suffisants pour l'ensemble de la planète.

Ensuite, pendant des années, rien ne se passe dans le domaine de la bureautique... les ordinateurs grossissent pour obéir à une loi qui prétend que le coût d'un ordinateur ne croit que comme la racine carrée de la puissance, et que donc il faut construire des machines de plus en plus grosses.

1.3.3. L’apport des grands ordinateurs centraux

Ces machines, d'abord exclusivement orientées 'traitement par lot' sont progressivement dotées d'un système d'exploitation (Operating System) permettant l'utilisation simultanée par plusieurs lots en parallèle. Puis elles deviennent utilisables à partir de terminaux interactifs orientés «lignes» et ensuite de terminaux dits intelligents «pleine page» (full screen). Malgré leurs caractères de système de «temps partagé» (time sharing), ces systèmes ne sont pas très puissants et surtout, ils ne supportent pas trop les interruptions. Le mode de fonctionnement est donc de préparer un jeu de données (une ligne ou un écran), de l'envoyer à l'ordinateur, puis de recevoir la réponse. Même si cet environnement parait peu propice à l'introduction d'une bureautique au sens actuel du terme, c'est sur de tels équipements que naissent les premiers éditeurs-formateurs ; les textes à produire sont frappés 'au kilomètre', par ligne ou par écran et des caractères de mise en page y sont introduits. Ces caractères indiquent par exemple qu'il faut à un moment sauter une ligne ou modifier une indentation. L'éditeur permet d’introduire le texte et son marquage défini par ces caractères de mise en page. Le formateur interprète ensuite le marquage et produit un texte correctement mis en page... s'il n'y a pas eu d'erreurs dans le marquage. A noter qu'à l'époque, il n'y a guère de support généralisé pour les graphiques ou les dessins ni pour les polices de caractères (le traitement de dessins pour des applications spécialisées tel le dessin industriel de plans est possible via l'utilisation de terminaux spéciaux contenant une mémoire d'écran).

Parallèlement à ces développements en matière de production de documents, les gros ordinateurs offrent souvent des services rudimentaires de messagerie interpersonnelle. Chaque utilisateur qui possède une identification possède une boîte aux lettres dans la machine. Il peut envoyer des messages simples à d'autres utilisateurs présents sur la même machine (en général, les firmes n'ont à cette époque qu'un seul ordinateur important pour toute l'entreprise).

13

1.3.4. L’arrivée des minis et le PARC

Vers les années 1970, DIGITAL inverse la tendance à construire des ordinateurs de plus en plus gros en lançant la ligne des mini-ordinateurs (tel les PDPs). Ces ordinateurs, plus petits, supportent quelques utilisateurs et sont orientés dès le début vers des applications 'temps réel' et multi-processus. Leur mode de fonctionnement est beaucoup plus orienté vers le traitement 'caractère par caractère'. Des éditeurs plus interactifs deviennent donc possibles. Ces éditeurs permettent, à chaque introduction d’un nouveau caractère dans un texte, de générer un action de mise en page spécifique.

Sur le plan des concepts, les années 1970 sont aussi une période très riche. C'est à cette période en effet que XEROX, à la pointe de l'innovation technologique, invente les concepts et les techniques clef de la Bureautique dans son PARC (Palo Alto Research Center). Parmi ceux-ci on retrouve :

Le concept de fenêtrage, d'écrans 'bit-map' (c-à-d contenant des points et non des caractères) et de souris. Ces éléments permettent d'imaginer une interaction avec l'ordinateur via l'intervention de l'utilisateur sur un monde 'virtuel' représenté à l'écran et non via un langage de commande plus ou moins ésotérique.

Le concept de réseaux locaux et plus généralement d'interconnexion à haute vitesse de plusieurs ordinateurs. Cette interconnexion est indispensable si l'on souhaite passer d'un modèle basé sur l'existence d'un ordinateur unique dans l'entreprise à un modèle basé sur l'existence de multiples ordinateurs plus petits mais plus interactifs. Les réseaux locaux de type 'ETHERNET' sont extrêmement rapides pour l'époque (4Mbits puis 10Mbits) et leur mode de fonctionnement permet une très grande décentralisation. Ils sont d'abord pensés pour permettre l'échange de documents, mais la révolution la plus importante qu'ils vont introduire sera d'introduire l'approche 'client-serveur' de construction des systèmes informatiques.

14

Les imprimantes à laser. Jusqu’alors, les imprimantes (à chaîne, à marguerite, à boule) sont toutes basées sur l’utilisation d’une matrice physique pour imprimer les caractères. Cela signifie qu’un changement de police de caractère au sein d’un document n’est pratiquement possible que si la tête de frappe contient les différentes polices utilisées. Cela signifie aussi qu’il est pratiquement impossible d’imprimer des dessins (sur les gros ordinateurs, on imprime des dessins grâce à des algorithmes de surfrappe de caractères. On peut ainsi produire des ‘posters’ assez jolis, mais bien entendu, cette technique donne des résultats très grossiers. Les dessins industriels sont eux produits sur des tables traçantes, très précises mais très lentes). Les imprimantes matricielles, fort utilisées au cours des années 1980, vont permettre la production de dessins mais leur résolution est trop faible pour reproduire des dessins de précision ou pour permettre l'utilisation de polices de caractères différentes. L'imprimante à laser, avec sa qualité équivalente à celle des meilleures machines à écrire électrique, son excellente résolution et sa bonne vitesse va résoudre le problème de production de documents en tout cas noir et blanc. Seule, l'apparition des techniques à jets d'encre vers la fin des années 1980 va remettre en cause sa suprématie.

Les langages d'impression. Pour commander les imprimantes à laser, il faut un langage de commande beaucoup plus souple que ce qui est nécessaire pour commander un autre type d'imprimante. Aussi, au lieu de définir un langage de commande, l'idée naît de créer un véritable langage de programmation orienté 'impression'. Le langage le plus populaire deviendra 'Postscript' inventé par ADOBE.

Les langages orientés objet (et en particulier le langage 'Smalltalk'). Il peut paraître bizarre de mentionner un langage de programmation comme une contribution majeure à l'établissement des concepts bureautique. Pourtant, 'Smalltalk' va populariser le concept d'orientation objet. Ce concept va jouer ensuite un rôle de plus en plus grand dans l'organisation des outils bureautiques et ce livre explique en détail le modèle de représentation proposé par l'approche objet.

Les jeux de caractère 16 bits. Dans le courant des années 1970, on a utilisé des jeux de caractères à 5 bits (code de type télégraphique), à 6 bits, à 7 bits (le code ASCII) et à 8 bits (le code ASCII étendu). Ces jeux de caractères ont chacun correspondu à des compromis différents entre la taille mémoire nécessaire pour représenter un texte et l'exigence de représenter des jeux de caractères de plus en plus riches. A cette époque aussi, la relation entre l'unité de stockage d'une machine (le 'mot' informatique donnant l'unité de stockage nécessaire pour une instruction machine élémentaire) et le nombre de bits nécessaires pour représenter un caractère est parfois des plus étrange. Ainsi, il existe des machines dont le "mot" fait 36 bits, exploitables soit comme un ensemble de 5 caractères de 7 bits, soit comme des demi-mots de 18 bits… XEROX, dès le début, estime que tous les caractères de toutes les langues doivent pouvoir être représentés et utilise dès lors un code 16 bits dans ses produits bureautiques.

15

Les traitements de texte interactifs. Bien que le concept soit en fait le fruit d'un ensemble de réflexions, les chercheurs du PARC sont certainement parmi les premiers à insister sur l'importance du 'WYSIWYG' (What You See Is What You Get).

Tous ces concepts aboutiront, début 1980, à l'introduction de la station 8010 'Star' conçue fin des années 1970, révolutionnaire, chère et à l'architecture fort fermée. Cette station inspirera énormément la conception du 'Mac Intosh' de APPLE.

Fin 1970, WANG lance son premier traitement de texte. D'autres firmes suivront et dans le début des années 1980, il y aura un marché bien développé de traitements de texte 'stand alone', basés sur des machines dédicacées stockant les textes sur disquettes. Parmi les firmes proposant de tels équipements, outre WANG, on trouve PHILIPS, OLIVETTI, NCR. Ces machines sont souvent dédicacées à un seul utilisateur. Parfois, elles peuvent être utilisées par plusieurs utilisateurs simultanément. A cette époque, on assiste donc à l'apparition de 'pool d'encodage' utilisés afin d'optimiser l'utilisation de ces machines encore fort chères et à l’apprentissage complexe. C'est bien sûr à cause de la facilité de révision des textes que ces équipements se répandent dans les entreprises. Cette bureautique de première génération va se développer pendant toutes les années 1980 et faire la fortune de WANG qui prend le leadership de ce marché et se diversifie dans la bureautique au sens le plus large. Ainsi, WANG introduit sa propre technologie réseau, basé sur une approche à large bande ('broadband') permettant de transporter des textes mais aussi de la vidéo ou des liaisons téléphoniques. Cette technologie paraît même un moment devoir remplacer ETHERNET et toutes les autres technologies en bande de base qui n'utilisent qu'un faible portion du spectre du câble coaxial qu'elles utilisent. Mais à l’usage, elle se révèle trop complexe, trop coûteuse (surtout en terme d’investissement d’étude) et surtout elle reste propre à WANG et est donc difficilement utilisable avec d’autres types d’équipement.

Toutes ces firmes de la première génération (y compris XEROX) ont d’ailleurs des architectures de produits qui sont propres au fabriquant et qui sont donc «fermées». Tant que le marché reste un marché de volume moyen, cette fermeture permet de générer des marges bénéficiaires importantes. L'arrivée du monde PC, avec ses productions à très fortes quantités et à très faibles marges, va bouleverser la structure de ce marché et la plupart des acteurs de la première génération bureautique vont devoir le quitter ou s'enfermer dans des produits de niche.

1.3.5. L’émergence des réseaux informatiques

Un autre domaine important qui se développe dans le domaine des années 1970 est celui des télécommunications. Il a déjà été question de la création d'ETHERNET dont la spécification définitive date de l'année 1980 avec la publication de la norme DIX (Digital, Intel et Xerox).

16

Dès 1973, la défense américaine crée le réseau ARPANET, basé sur la spécification d'un protocole appelé TCP/IP (Transport Control Protocol-Internet Protocol). Ce réseau et ce protocole continueront à se développer et au cours du temps, d'extension en modification de statut, ARPANET deviendra INTERNET. Quand à TCP/IP, après des années de conflits avec les protocoles propriétaires d'IBM (SNA: System Network Architecture), de DEC (DECNet) et surtout après des années de discussion sur le choix entre standards officiels (norme de l'ISO (International Standard Organisation) ou CCITT (Comité Consulatatif International du Télégraphe et du Téléphone)) et standards 'de facto' (c-à-d TCP/IP), il finira par s'imposer définitivement comme le seul protocole d'interconnexion dans le début des années 1990.

Les années 1976-1980 sont particulièrement riches dans le domaine des télécommunications. La norme X25 est définie en 1976 et sera la base pour les réseaux publics à commutation par paquets. Les normes X3, X28 et X29 la complètent et permettent l'utilisation du réseau à partir de terminaux en mode ligne reliés au réseau téléphonique. Début des années 1980, c'est aussi la définition des protocoles VIDEOTEX. Faute d'un accord entre les différents pays européens, il y aura 3 normes VIDEOTEX en Europe et le réseau VIDEOTEX ne démarrera vraiment qu'en France (Minitel).

L'ISO définit en 1976 le modèle OSI (Open System Interconnexion) en 7 couches, qui restera la référence notamment terminologique en matière de réseau. Pour des raisons essentiellement politiques (indépendance vis-à-vis des constructeurs informatiques pour les couches de protocoles non contrôlées par les administrations des postes, toutes puissantes en Europe à cette époque), l'ISO se lance aussi dans la définition des protocoles pour les différentes couches du modèle OSI... en ignorant le monde TCP/IP. Cette définition, qui anticipe sur les produits, deviendra un 'travail stratégique' pour toute une série de constructeurs d'ordinateurs européens coincés entre le monde IBM d'une part et le monde des mini et des micro-ordinateurs d'autre part, et qui espèrent ainsi que les administrations publiques généreront un marché de 'produits normés' pour lequel ils auront un avantage compétitif.

L'incohérence du travail de normalisation (il y aura 5 classes de protocoles pour la couche de transport (couche 4)) et l'antagonisme 'constructeurs-PTT' se matérialisant autour de l'aspect 'orienté connexion' ou 'hors connexion' pour la couche réseau (ce problème de la structure de la couche 3 ne sera jamais résolu) ainsi que le refus effectif des administrations publiques de payer plus cher leur acquisition pour obtenir des produits normés (mais qui n'interopèrent pas !) conduiront à l'échec de cette approche sauf dans certains marchés de niche.

17

1.3.6. L’arrivée des PCs

Vers le milieu des années 1980, les premiers PC font leur apparition avec essentiellement le PC d'IBM (dont le système d'exploitation a été développé par une petite firme appelée MICROSOFT) et le Mac Intosh d'APPLE (qui succède à l'Apple II après l'échec du Lisa). Ce sont des PCs utilisant des disquettes capables d'enregistrer quelques centaines de kilobytes. Immédiatement, ces machines, qui ont des écrans 'bit-map' capables de représenter des dessins, des graphiques ou des textes avec polices de caractères, deviennent les concurrents des traitements de texte spécialisés. Certains programmes, tels Wordstar et Wordperfect sur PC deviennent des standards. Le Mac Intosh, avec son ergonomie révolutionnaire et son intégration entre toutes les applications devient la référence en bureautique. C'est sur cette plateforme que MICROSOFT développe la version 'à fenêtrage' de son traitement de texte 'Word'. Le Mac Intosh aurait pu devenir la plateforme universelle bureautique mais la politique de fermeture d'APPLE qui garde le monopole de la fabrication des machines, du système d'exploitation (et qui essaie d'imposer son propre système de réseau local) va permettre au marché PC de se développer, un peu anarchiquement...

Début 1980, a lieu aussi une invention qui va révolutionner aussi l'usage du PC et qui va élargir la définition du concept de bureautique: le tableur. Celui-ci permet à des non-informaticiens de programmer des calculs et d'effectuer des simulations. Le tableur va soutenir l'expansion du monde PC grâce à la dominance de LOTUS (qui remplace 'Visicalc' de l'inventeur du tableur VISICORP). Il va aussi briser l'égalité "informatique = programmeurs spécialisés".

Tous ces développements conduisent à l'effondrement du marché bureautique spécialisé en quelques années et conduisent à la fortune de MICROSOFT, APPLE et NOVELL (qui crée un système de réseau spécialisé orienté PC).

1.3.7. Les grandes études bureautiques

Du point de vue conceptuel, la fin des années 1980 est l'époque des grandes études bureautiques basées sur des démarches classiques utilisant des diagrammes de flux et des analyses des besoins et inspirées des approches utilisées pour construire les grands systèmes d'information de l'entreprise. Alors que les produits s'engagent résolument dans une approche "bottom-up" assez anarchique, ces réflexions sont résolument "top-down" essayant de partir du "business", d'en déduire les besoins et ensuite les solutions. Le résultat de ces études est souvent très globalisant et vise à informatiser tout le circuit papier de l'entreprise. Le concept de "paper-less" office est très populaire et soutient ces études.

Ces approches vont toutes se solder par des échecs dont les causes les plus importantes sont les suivantes :

18

Les moyens nécessaires pour implémenter les solutions préconisées ne sont pas encore disponibles. Ainsi, en matière de réseau, les réseaux interentreprises sont peu performants et les réseaux locaux intra-entreprises sont morcelés ou inexistants. La capacité de stockage sur disque est trop chère pour y laisser des documents en permanence et la résolution des écrans est trop faible que pour pouvoir manipuler des dessins.

Ces approches imitent les démarches suivies pour créer les systèmes d'information classiques utilisés par exemple pour gérer la comptabilité ou la gestion de stock. Ces systèmes d’information classiques sont développés par l'entreprise. Ils sont créés par décomposition hiérarchique, ce qui permet d'identifier des modules élémentaires qui peuvent alors être construits spécifiquement de façon à pouvoir travailler entre eux. Par opposition, dans le monde bureautique, les modules sont à cette époque fournis par des firmes différentes et ils n'ont pas été construits pour fonctionner ensemble. Ce problème d'intégration, qui va être le grand thème bureautique dans le début des années 1990 n'est pas encore compris fin des années 1980. Et les études bureautiques concluent à la faisabilité de certaines approches bureautiques sur base de l'existence des modules élémentaires (traitement de texte, tableurs, courrier électronique) sans s'apercevoir qu'il est pratiquement impossible de faire travailler ces différents produits ensemble.

Par sa nature décentralisée, la bureautique amène les entreprises dans des domaines qu'elles maîtrisent moins : utilisation de réseaux, installation massive d'équipements, distribution de logiciels à un grand nombre de stations, gestion de bases de données non structurées. La plupart des études de cette époque sous-estiment les difficultés qu'entraîne la maîtrise de ces nouveaux domaines.

Plus généralement, la définition de l'architecture à mettre en place n'est pas claire. Certains concepts clef, comme l'orientation objet et surtout les architectures «client-serveur» ne sont pas encore fort connus. En leur absence, les architectures bureautiques proposées se basent surtout sur des assemblages hétéroclites de solutions peu fiables.

1.3.8. Les incertitudes du début des années 1990 et Unix

L'échec de ces approches va conduire à une période difficile. Le parc des PC explose au sein des entreprises, ceux-ci étant achetés de façon anarchique parce que leur prix unitaire est situé en dessous des seuils de contrôle. Ces PCs sont utilisés pour rendre les services bureautiques de base (traitement de texte, tableur) et génèrent des gains de productivité immédiats. Mais les problèmes liés à cette croissance anarchique apparaissent aussi : obsolescence rapide des équipements, difficulté d'assurer un minimum de gestion (sauvegarde des données, résolution de problèmes techniques) et surtout manque d'intégration conduisant à des multiples resaisies de la même information (traitements de texte différents, absence de communication entre logiciels bureautiques différents).

19

Techniquement, 1990 est une période de grande incertitude technique. Le monde Mac Intosh, toujours aussi convivial, est toujours aussi fermé, ce qui rend cette solution plus chère et surtout plus difficile à intégrer avec les systèmes non Mac Intosh, comme les systèmes d'information existants de l'entreprise. Le monde PC s’essouffle ; les interfaces PC sont peu conviviales, les limitations techniques du DOS deviennent insupportables, l'annonce par MICROSOFT et IBM de l'arrivée imminente d'OS/2 paralyse le développement de nouvelles applications et surtout les gestionnaires de la bureautique au sein de l'entreprise ne supportent plus le caractère hétéroclite de l'environnement qui rend impossible leur travail d’aide de l’utilisateur.

C'est à cette époque que UNIX parait soudain être la solution à tous ces problèmes. Basés sur un système d'exploitation éprouvé et sans grandes limitations (en tout cas vis-à-vis de DOS), il est multitâche (ce qui facilite la résolution des problèmes d'intégration) et multi-utilisateur et il peut donc supporter les approches 'mini' de la première génération bureautique. C'est un système d'exploitation 'source' c'est à dire facilement portable sur de nouvelles machines. Et son principal problème dans le passé, l'absence de système de fenêtrage est en train de se résoudre avec l'arrivée de X-WINDOW. Ce système de fenêtrage révolutionnaire est dès le départ orienté 'réseau' et il permet de construire des 'terminaux X', qui peuvent être gérés comme des terminaux classiques.

L'échec de UNIX comme «desktop» (c-à-d équipement de support de l’utilisateur final) sera dû à l'absence d'accord sur une standardisation des interfaces de haut niveau pour accéder au système de fenêtrage. La guerre entre les 2 standards proposés (MOTIF et OPEN LOOK) et l'existence de 2 grands dialectes UNIX bloqueront le développement des applications. La technologie 'X' s’avérera être gourmande en bande passante réseau. L'absence de systèmes d'administration communs pour gérer des machines provenant de vendeurs différents rendra illusoire l'indépendance vis-à-vis du fournisseur. Et l'arrivée de MS-WINDOWS 3.x brisera définitivement cette approche.

1.3.9. Le triomphe du PC et la domination de Microsoft

MS-WINDOWS 3.x va s'imposer rapidement comme la plateforme universelle bureautique (et plus généralement comme le 'desktop' universel), principalement à cause de la stratégie de MICROSOFT qui va synchroniser le démarrage de cette version du système d'exploitation avec le lancement de 2 applications bureautiques qui en exploitent les propriétés : Word et Excel (rejoint plus tard par d'autres produits tels Powerpoint et MS-Access). Les concurrents de MICROSOFT, en général orienté OS/2, vont être pris au dépourvu et leurs applications vont prendre plusieurs mois de retard avant d'être mises sur le marché (ces premières versions sont d'ailleurs généralement d'assez mauvaise qualité).

20

MS-WINDOWS étant multitâche (non préemptif), il va permettre de résoudre les problèmes d'intégration. MICROSOFT introduit aussi des mécanismes standards qui facilitent l'interopérabilité des applications tels DDE, OLE1, OLE2 et l'usage généralisé des DLL (ces termes sont expliqués plus loin dans ce livre). Comme il applique ces nouveaux mécanismes au sein de ses propres produits et que ceux-ci sont populaires, il crée ainsi un 'cercle vertueux' qui oblige pratiquement tout le marché à s'aligner sur ses spécifications malgré la tentative de créer des architectures concurrentes (tel OpenDoc).

MICROSOFT devient progressivement l'entreprise dominante du marché bureautique, suivi essentiellement par LOTUS et WORDPERFECT. Pour faciliter la résolution des problèmes d'intégration, MICROSOFT lance le concept de 'suites', ensemble d'applications indépendantes mais conçues pour fonctionner ensemble et offrant une interface utilisateur harmonisée. Le marché s'oriente alors résolument vers cette approche et les 3 acteurs dominant du marché définissent chacun leur suite ('Office' pour MICROSOFT, 'Smartsuite' pour LOTUS et 'PerfectOffice' pour WORDPERFECT). Le problème pour ces 2 derniers intervenants est que leur suite est basée sur des produits développés par des compagnies indépendantes ultérieurement rachetées et que l'intégration et l'harmonisation des interfaces se révèlent plus difficiles pour eux dans un monde dont ils ne maîtrisent pas les règles. L'arrivée de Windows 95 et l'apparition simultanée de Office pour Windows 95, le rachat de LOTUS par IBM, l'achat puis la revente de WORDPERFECT par NOVELL laisse présager une situation de quasi-monopole de MICROSOFT sur le 'desktop' pour les prochaines années avec sans doute une certaine concurrence de LOTUS. Le poids d'IBM et sa supériorité dans le domaine du 'Groupware' (avec son produit 'NOTE') lui permet en effet de préserver une part de marché.

En ce qui concerne les télécommunications, le début des années 1995 a vu l'émergence universelle de TCP/IP comme protocole réseau grâce à l'explosion du phénomène INTERNET. INTERNET, dont les origines lointaines datent de 1973 a vu pendant des années son nombre d'utilisateurs doubler tous les ans... et comme dans toute croissance exponentielle, cela signifie que brutalement INTERNET est passé d'un état 'connu seulement par les initiés' à un état 'indispensable pour chacun'. Deux événements ont contribué à soutenir l'expansion ces dernières années ; d'abord la décision, début des années 1990 de permettre à des organisations commerciales d'accéder au réseau (auparavant, il s'agissait surtout d'un réseau orienté 'recherche'), et ensuite l'apparition du WWW (World Wide Web) qui a permis un accès convivial aux documents présents sur le réseau. Chaque année, le monde INTERNET s'enrichit aussi de concept (Applet, JAVA) mais dans ce domaine aussi, après un début assez peu réussi, MICROSOFT semble s'imposer, au moins au niveau des outils 'Desktop'.

21

Enfin, un domaine prépare sa croissance dès que les conditions adéquates seront réunies : celui des serveurs bureautiques. Il s'agit essentiellement des systèmes permettant de stocker des documents et de faciliter leur recherche. Pendant longtemps, seul Unix semblait capable de supporter ces serveurs. Ce qui obligeait à porter les logiciels sur chaque plateforme Unix différente. L'émergence de 'NT' (de MICROSOFT encore...) a résolu ce problème. L'apparition aussi de systèmes à grande capacité de stockage à faible coût devrait aussi contribuer à développer ces systèmes. Ces serveurs peuvent supporter des systèmes de gestion électronique de documents (GED). Ils peuvent supporter des librairies de documents HTML (le langage du WWW). Ils peuvent aussi servir de relais entre un monde orienté 'document' familier à la plupart des personnes et le monde orienté 'base de donnée' des informaticiens et des gestionnaires spécialisés.

Sur le plan des concepts, les techniques d'intégration entre différents logiciels sur le 'desktop' sont maintenant bien maîtrisées. Ces techniques ont été étendues pour pouvoir être utilisées à travers un réseau. L'émergence de nouveaux concepts tel le 'workflow' ou le 'groupware' (définis souvent de façon assez floue) montre la nécessité de maîtriser maintenant les relations complexes entre les différents utilisateurs de la bureautique ainsi que l'interaction entre bureautique et systèmes d'information. Même si les concepts dans ce domaine sont encore flous et les produits encore pauvres, il semble bien que le concept clé dans toutes ces approches soit le concept de document.

1.4. Qu’est ce qu’un document ?

Comme cela a été brièvement mentionné dans l'introduction, si on essaie de définir un document, on devrait obtenir une multitude de réponses différentes. Partant du niveau de représentation le plus élémentaire (on dira le niveau de richesse de représentation le plus faible) vers le niveau de représentation le plus sophistiqué, on pourrait avoir les descriptions suivantes dans le cas d'un document composé simplement de texte :

Un document peut être vu comme un ensemble de pages, chaque page étant un ensemble de point soit noir soit blanc. C'est la représentation 'bitmap' du document, telle qu'elle est finalement générée par l'imprimante 'laser' ou 'deskjet' qui doit imprimer le papier. C'est aussi la représentation qui sera fournie par un scanner. Cette représentation supporte du texte mais aussi des photos, des dessins ou des tableaux. Elle est supportée par les logiciels de dessins orientés 'bitmap' (tel que 'Paintbrush') ou par des logiciels de retouche photo.

Un document textuel peut aussi être vu un ensemble de pages, chaque page étant un ensemble de courbes. Chaque courbe obéit à une équation qui la définit et est associée à une position sur la page, à un facteur d'échelle (taille) et à une orientation. Cette représentation est capable de représenter les textes mais aussi les dessins ou les tableaux. Elle est utilisée par les logiciels de dessin vectoriel et par des formats de représentation tel que 'Postscript' décrit plus loin dans ce livre.

22

Chapitre 2: UN OBJET COMPLEXE, LE DOCUMENT

Un document textuel peut être aussi vu comme un ensemble de pages, chaque page étant un ensemble de caractères individuels. Chaque caractère est tiré d'un alphabet et associé à une position sur la page, une police de caractère, un facteur d'échelle et une orientation. Cette représentation 'caractère individuel' ne permet bien sûr que de représenter du texte ou des tableaux (si l'alphabet contient quelques caractères spéciaux).

Un document textuel peut aussi être vu comme un ensemble de pages, chaque page étant un ensemble de segments de texte. Chaque segment contient un certain nombre de caractères, chaque caractère appartenant à une même police de caractère, ayant le même facteur d'échelle et la même orientation que les autres caractères du segment. Un segment est associé à une position dans la page, une orientation et une politique en matière d'espacement des caractères qu'il contient (à moins que cette politique ne soit associée aux polices de caractère). Cette représentation, similaire à celle du mode 'bloc' décrit plus loin est celle du 'texte fixe simple' dans certains générateurs de rapport ou dans certains outils de dessin.

Assez proche de la représentation précédente, la représentation en mode ligne où la page est divisée en lignes équidistantes, chaque ligne contenant une suite de caractères (ayant leur propre police et leur propre taille) et définissant certains comportements globaux tel que le fait d'être ajusté à gauche, à droite, centré ou justifié. Le mode ligne a été particulièrement populaire avec des éditeurs de programmes où tous les caractères avaient la même police, et éventuellement la même taille.

Un mode de représentation original, variante du mode 'segmenté' serait de prévoir que chaque segment contient exclusivement un mot tiré d'un ensemble de mots. Chaque mot peut être identifié simplement par un nombre identifiant sa place dans l'index des mots. Chaque segment contiendra aussi alors dans ce cas l'information nécessaire pour signaler si le mot est écrit en majuscule, minuscule (avec éventuellement la première lettre en majuscule). Cette représentation a l'air peu réaliste mais elle est cependant utilisée par certains systèmes de recherche documentaire.

Un document peut aussi être vu comme un ensemble de blocs, chaque bloc contenant du texte formé d'une suite de caractères. Le bloc est un peu similaire au segment mais il doit aussi contenir les règles pour effectuer le passage à la ligne en respectant la césure des mots. Au sein d'un bloc, on pourra aussi avoir des 'suites de caractères', chaque suite représentant un ensemble de caractères qui ont la même police et la même taille. Les blocs peuvent être placés arbitrairement dans une page. Cette représentation est celle du texte dans beaucoup de logiciels de dessin.

23

La notion de bloc est à la base d'un bon nombre de variations que l’on retrouve dans beaucoup de traitements de texte disponibles sur le marché. Ainsi, on peut décider que les blocs doivent être alignés de façon séquentielle sur les pages et définir les règles de coupures d'un bloc par un saut de page. Chaque bloc devient alors un container pour recevoir un titre, un paragraphe ou un item de liste. Chaque bloc peut avoir ses propres règles de mise en page définissant le défaut pour les polices de caractères et les tailles des caractères à l'intérieur du bloc. Le bloc défini aussi si le texte est aligné à gauche, à droite, centré ou justifié et quelles sont les indentations par rapport aux frontières du bloc (la première ligne pouvant avoir une indentation particulière). Il est aussi possible de définir un type associé à chaque bloc et ainsi de définir les séquences 'naturelles' de blocs. Ces blocs sont souvent appelés "styles".

En prolongeant l'idée des styles jusqu'à son point extrême, on peut définir les types de blocs possibles comme par exemple les chapitres (et leur titre), les paragraphes et les listes, les phases et les mots et définir une grammaire rigide liant l'enchaînement des blocs. Ces blocs deviennent alors une hiérarchie où un chapitre est par exemple formé d'un titre (lui-même formé de mots), suivi d'une suite de paragraphe, chaque paragraphe comprenant une suite de phrases et/ou de listes. Certains éléments peuvent être récursifs comme les chapitres (divisés en sous-chapitres) ou les listes (divisées si nécessaire en sous-listes). La mise en page peut être définie par des variables (par exemple 'retrait = 1 cm') ou par des instructions (par exemple 'reculer le pointeur de 1cm') associée à chacun des types de bloc et le texte ne se définit plus que par une description ne faisant plus référence du tout à la mise en page.

Une autre prolongation de cette même idée consiste à rattacher chaque document à une classe de document décrivant les types de blocs existants et leur enchaînement possible. Les classes de document forment alors une hiérarchie où les classes très générales (c-à-d peu contraignante sur la structure du document) sont proches de la racine de la hiérarchie et les classes les plus particulières représentent des documents très structurés (type formulaires). Par exemple la classe la plus générale (la racine de la hiérarchie) définira juste un document comme une suite de bloc, une de ses filles sera une lettre type (qui contiendra comme bloc l'adresse, la date, la formule de politesse et la signature) et une fille de la lettre type sera par exemple une lettre d'excuse pour le fait de ne pouvoir assister à une présentation (où il y aura un bloc identifiant le nom de la présentation et la date où elle doit avoir lieu).

Cette structuration peut être telle que certains documents peuvent alors voir le contenu de certains blocs provenir de relations stockées dans une base relationnelle. Ainsi, la date de la présentation peut n'être que l'expression d'une relation liant la présentation à sa date et stockée dans une base relationnelle. Si la structuration est très forte, le document peut n'être que l'association d'un identificateur de type de document et du contenu d'un jeu de table relationnelle (référencée par le type du document). Communément, ce type de document s'appelle 'rapport' dans le monde relationnel.

24

Il sera peut-être aussi possible un jour d'exprimer chaque phrase d'un texte dans un langage formalisé représentant la sémantique de la phrase (sous forme de relations et d'actions). On aurait ainsi une représentation abstraite indépendante de la langue qu'il 'suffira' d'imprimer en convertissant la représentation abstraite dans un ensemble de phrases dans une langue donnée, puis de là dans une représentation sur papier. Un rêve qui n'est sans doute pas pour demain.

A la lumière des exemples, on comprend mieux pourquoi le traitement des documents est quelque chose de complexe. Certaines représentations sont mieux adaptées à certains types de traitement. Ainsi, un analyseur de grammaire doit, si possible, avoir accès à la notion de phrase ou de mot. Il en est de même d'un programme de traduction automatique. Un traitement de texte doit avoir accès à la notion de césure des mots, alors qu'un outil de coloriage pourrait se satisfaire d'une représentation 'bit-map'.

Encore, les exemples donnés se rapportent-ils tous à un 'type' de document très simple, à savoir un document contenant seulement du texte. Il y a aussi des documents qui contiennent de la voix, des photos, qui donnent accès à des tableaux dynamiques (tableurs).

Pour terminer, et sans faire trop d'analyse à ce stade, on peut aussi remarquer qu'il semble y avoir 'un ordre' dans la définition des documents. Un texte formé de 'blocs', peut être converti en segments, puis en lignes et finalement en pixels. Les transformations inverses semblent plus difficiles.

1.5. Bases et définition d’un document

On voit donc qu'il n'y a pas une définition d'un document mais bien toute un ensemble de définition. Toutes ces définitions suivent cependant les mêmes principes.

Tout d'abord, une définition d'un document se fait en fonction d'une base (le terme 'base' a été choisi volontairement par analogie avec l'utilisation de ce même terme en mathématique). Cette 'base' définit les éléments qui vont servir à exprimer les documents. Le document est en effet représenté en créant un certain nombre de ces éléments de base et en donnant les valeurs correctes aux paramètres qu'ils supportent.

Pour chacune des descriptions au chapitre précédent, on donc peut décrire la base et les paramètres dont les valeurs définissent le document:

Dans la description 'bitmap', la base comprend la page et le point. Un document est représenté par un certain nombre de pages, chaque page comprenant un certain nombre de points (noir), chaque point ayant (au minimum) une position par rapport à la page soit 2 coordonnées. Les paramètres de la page sont donc le numéro de page et les paramètres de chaque point sont sa coordonnée

25

Dans la description 'courbe', la base comprend aussi la page ainsi qu'un certain nombre de courbes, parmi lesquelles en général le segment de droite, l'ellipse (dont un cas particulier est le cercle), le polygone (qui pourrait être construit à partir de droites mais qui, en temps qu'élément fermé, contient un 'intérieur' et un 'extérieur' comme l'ellipse). Il y a aussi souvent une courbe telle une courbe de 'Bézier' capables de s'ajuster à une série de points. Chacune de ces courbes a des paramètres qui lui sont propres (longueur d'un segment de droite, foyer d'une ellipse, nombre, orientation et longueur des segments d'un polygone, points de passage d'une courbe de Bézier) ainsi que des paramètres généraux tels que la position, l'orientation et l'échelle. Le document s'exprime en créant un certain nombre de ces éléments et en fournissant les valeurs des paramètres.

La description 'caractère' utilise comme base la notion de caractère. A chaque caractère est associé un nombre qui représente la 'valeur' du caractère ainsi qu'une référence à une autre notion de base à savoir la notion de police de caractère. Celle-ci définit la forme du caractère selon sa valeur et ne fait, en général, pas partie du document. Chaque caractère possède aussi une position, une orientation, un facteur d'échelle. Un document est décrit en créant une série de caractères et en donnant les valeurs des paramètres (police, position...). Le 'caractère' est utilisé comme base pour de nombreuses autres descriptions.

Les descriptions segmentées ou par blocs, utilisent évidemment ces éléments comme éléments de base. Un document est représenté en définissant les blocs adéquats, en donnant les paramètres nécessaires tels que la position ou les règles en matière de coupures de pages. Dans ces blocs sont définis par exemple les segments qui contiennent eux-mêmes les caractères.

La représentation par mot n'utilise pas le caractère comme élément de base mais bien le mot. Chaque mot est défini dans l'index (l’ensemble des mots) en fonction de caractères, mais ceci n'est pas une caractéristique du document (l'index n'est pas défini dans le document). Le mot sera donc identifié par un nombre qui identifie sa place dans l’index (qui sera par exemple alphabétique).

De la même façon, dans une représentation qui fait intervenir une base relationnelle, le document est souvent constitué d'un 'masque' (lui-même défini de diverses façons) et des 'champs'. Chaque champ est défini par une extraction d'une base relationnelle c'est à dire par le contenu d'une colonne pour une ligne d'une table relationnelle. Cette extraction est définie par une requête dans la base. Cette requête doit retourner une seule valeur (texte ou nombre le plus souvent). D’autres approches sont possibles. Ainsi on peut définir un document comme une extraction d'une base relationnelle donnant la valeur de plusieurs champs et plusieurs lignes. Cette extraction est définie par une requête ‘SQL’ et des instructions de mise en page précisant comment présenter les lignes et les colonnes.

Dans une description sémantique générale, tout le problème est bien sûr de définir une série d'éléments de base capables de représenter de façon générale n'importe quelle phrase ayant une signification, indépendamment du langage.

26

Ces exemples permettent de mieux comprendre la relation entre les différentes descriptions. Cette relation peut être mieux appréhendée en examinant le processus de conversion d'un type de description à un autre. Ce processus de conversion est particulièrement important si on se rappelle que le seul type de représentation qui est imprimable sur le papier avec les imprimantes actuelles (ou qui peut être affichée sur un écran) est la représentation 'pixel'.

Il est à signaler que la définition d'un élément de base ne fait pas partie du document. Un document ne comprend pas la définition d'un 'point' s'il est 'pixel' ou d'une courbe de Béziers s'il est orienté 'courbe'. Ces définitions sont externes ; elles peuvent être physiques (visuelles) dans le cas d'un point ou se faire en terme d'une autre représentation en général moins complexe. On a ainsi un emboîtement de définition d'éléments de base dont la racine est le point pour les documents visuels statiques, le point et le temps pour le document visuel dynamique et l'intensité sonore et le temps pour le document sonore.

1.6. Conversion de représentation, richesse et appauvrissement

On peut classer les différents types de conversion selon la correspondance qu'il y a entre les éléments de base du système à convertir (la source) et les éléments de base du système résultat de la conversion (la cible). Selon le cas, on pourra avoir :

Les processus de conversion monoélement. Dans ce type de conversion, à chaque élément de la base de la source, on peut définir une conversion dont la complexité dépendant plus ou moins de l’environnement.

Les processus de conversion multiélément. Dans ce type de conversion, la conversion d’un élément de la source n’a pas de signification. La conversion ne peut se faire que si on considère plusieurs éléments de la source pour aboutir à la génération d'un ou plusieurs éléments de la cible.

Un processus de conversion monoélément sera par exemple la conversion d’un caractère en pixel. Un exemple de conversion multiélément sera par exemple la conversion inverse veillant à partir d’un ensemble de pixels à reconstituer un caractère. De façon générale, l'inverse d'un processus de conversion monoélément est un processus de conversion multiélément.

Un processus de conversion multiélément est en général beaucoup plus complexe à mettre en œuvre de façon automatique parce qu'il n'est pas facile de définir quels sont les éléments à prendre en compte pour faire la conversion. De plus, dans la plupart des cas, toutes les combinaisons possibles d’éléments que l’on peut rencontrer ne sont pas convertibles. Enfin, dans certain cas, certaines combinaisons d’éléments sont ambiguës (ont plusieurs conversions possibles), surtout s’il existe une incertitude sur l’existence ou non de certains éléments et sur la valeur de leurs paramètres.

Pour illustrer ces 3 problèmes, on peut noter que dans le passage d’un ensemble de pixel à un ensemble de caractères, on peut rencontrer :

Des ensembles de points qui ne correspondent pas à des caractères, comme par exemple, la rencontre de l’ensemble de points ‘€’.

27

Des ensembles de points qui correspondent à plusieurs caractères, comme le chiffre ‘1’ (un) et la lettre ‘l’ (‘L’ minuscule) (bien qu’en fait il y ait en réalité dans la police choisie une différence entre les deux lettres, cette différence peut être inexploitable en cas d’incertitude sur la position réelle, voire l’existence réelle d’un point).

Comme une conversion monoélément est plus facile à mettre en oeuvre qu’une conversion multiélément et que l’inverse d’une conversion monoélément est une conversion multiélément (dans la plupart des cas), on comprend qu’il y a un sens ‘facile’ de conversion et que la conversion inverse est plus difficile voire impossible. Si on a deux représentations d’un même document, on pourra dire qu’une représentation est riche et que l’autre est pauvre lorsqu’il est possible de passer de la représentation riche à la représentation pauvre via des conversions monoélément. La notion de ‘richesse’ d’une représentation est essentielle pour la compréhension de l’organisation de la bureautique d’une organisation.

La conversion d’une représentation «riche» en une représentation «pauvre» consiste un processus d’appauvrissement.

Certains appauvrissements sont en principe réversibles et d’autres ne le sont pas. Ainsi une conversion caractère vers bitmap est normalement non appauvrissante (on suppose que chaque caractère a une représentation bitmap unique même le 'l', le '1' ou le 'i'). Cela signifie que la conversion multiélément inverse est en principe possible (mais bien sûr, cela ne veut pas dire qu'à partir d'un document scanné ou reçu comme FAX, il est possible d'identifier sans erreur chaque caractère). Par contre une conversion 'segment vers caractère' est appauvrissante parce que la conversion d'un segment de plusieurs caractères a la même conversion que 2 segments résultant de la 'coupure' de ce segment en 2. Comme autre exemple de conversion irréversible, on peut remarquer qu'il peut être impossible de reconstituer la structure d’un texte au départ de la seule représentation caractère parce que notamment il est impossible de distinguer les sauts de ligne qui marquent la structure (fin de paragraphe), des sauts de ligne générés par le processus de conversion des blocs.

Lorsqu'un appauvrissement est irréversible, on ne peut passer de la représentation pauvre qu’à la représentation riche qu’en injectant de l'information supplémentaire lors du processus de conversion. Ainsi dans l'exemple du saut de ligne mentionné ci-dessus, le 'sens' du texte permet de savoir si c'est un vrai ou un faux saut de ligne mais cette information n'est pas dans la description du document et doit être générée à l'extérieur de celle-ci. De même, dans un processus de conversion d’une représentation «pixel» vers une représentation «caractère», opérant en présence de bruit, on pourra s'aider d'un dictionnaire de mots pour la langue dans lequel est supposé être écrit le texte, pour améliorer le qualité de la conversion. L'être humain, lorsqu’il un texte, part en pratique, d'une représentation «pixel» fortement dégradée et est capable de reconstituer la structure de celui-ci... après un processus d'apprentissage qui prend de longues années et lui permet de synthétiser ces règles de reconstitution s'appuyant sur les différents niveaux auquel un texte peut être décrit.

28

De façon générale, une conversion monoélément est d'autant plus appauvrissante qu'elle génère un nombre important d'éléments de base 'libre' dans la destination et que la 'distance' entre le résultat de la conversion de chaque paire d'éléments est plus grande. Ainsi la conversion d'un texte caractère en ligne de code 'Morse' basé sur un alphabet composé au maximum de 4 traits courts ou longs bien différenciés ou la conversion d'un texte en codes à barre spécialement conçus pour être bien différenciés est moins appauvrissante qu'une représentation par une matrice de 6 fois 8 points où certaines paires de caractères ont pratiquement la même représentation.

La notion de richesse d’un document et d’appauvrissement a bien entendu une analogie forte avec le domaine de conversion de différentes formes d’énergie tel qu’il est étudié par la thermodynamique. Dans cette science, on traite également de l’irréversibilité de certaine conversion, irréversibilité qui se traduit en pratique par l’introduction de la notion d’entropie qui mesure en quelque sorte la « richesse » d’une forme d’énergie.

On peut raffiner la classification des conversions monoélément de la façon suivante. On dira qu’une conversion monoélément est

Directe si pour chaque élément de base appartenant à la source, il est possible de générer les éléments de base de la cible simplement en examinant chaque élément de la source individuellement. Un exemple de conversion direct est la conversion d'une description 'caractère' en une conversion 'bitmap'. La conversion ne fait intervenir que les paramètres associés à chaque caractère, à savoir sa position, son orientation, son facteur d'échelle ainsi que sa valeur et la police associée. Bien sûr la conversion fait intervenir aussi la définition de la police de caractère mais cette définition est 'externe' au document.

Hiérarchique si, pour chaque élément de base appartenant à la source, il est possible de générer les éléments de base de la cible simplement en examinant chaque élément individuellement ainsi que les éléments de base qui l'englobent. Il s'agit d'une extension immédiate du processus de conversion direct. Un exemple est la conversion d'une description par segment en conversion 'bitmap' pour des polices de caractères non proportionnelles (c-à-d où tous les éléments ont la même taille). La conversion de chaque caractère dépendra en effet d'informations attachées au segment tel que la position, la police, l'orientation et le facteur d'échelle du segment mais aussi d'informations propres à chaque caractère tel que la valeur du caractère et sa position dans le segment.

Contextuelle si, pour chaque élément de base appartenant à la source, il est possible de générer les éléments de base de la cible simplement en examinant chaque élément individuellement ainsi que les éléments qui ont déjà été convertis. Un processus de conversion contextuel est une extension de la notion de processus de conversion hiérarchique. Ainsi, dans une description segmentée, lorsque les polices de caractères sont proportionnelles (c-à-d que tous les caractères n'ont pas la même taille), la position de chaque caractère dépend de la position du segment mais aussi des valeurs des caractères qui l'ont précédé dans le segment. Toutes les représentations procédurales sont en général contextuelles parce que l'effet d'une action dépend de l'"état" du système qui est fonction des actions qui ont été faites antérieurement.

29

Contextuels avec annulation si le processus de conversion est contextuel et que la conversion d'un élément de base peut forcer l'annulation de conversion d'éléments déjà faite et demander la conversion à nouveau de ces éléments en modifiant les paramètres de conversion. C’est le cas le plus général tel qu’il se présente dans les traitements de texte et les autres représentations par bloc. En effet, dans un bloc, la position des caractères dépend de la valeur des caractères qui ont déjà été convertis et la conversion d'un nouveau caractère en fin de ligne peut annuler la conversion de caractères déjà faite et demander une nouvelle conversion à partir de la ligne suivante. Il en va de même lorsqu'un bloc commence au bas d'une page, où l’ajout d’une nouvelle ligne, la conversion de lignes déjà converties peut être annulée afin de reporter certaines lignes sur la page suivante et ainsi respecter les contraintes de veuve (ne pas commencer un bloc au bas de la page s'il n'est possible que d'y placer une seule ligne) et d'orphelin (ne pas laisser une ligne terminant un bloc isolée en tête de page). La mise en page d'un texte avec des notes en bas de page ou des dessins exige aussi parfois l'annulation d'actions effectuées dans le passé pour respecter les règles de mise en page.

Dans les processus de conversion multiéléments, on peut y aussi introduire des classification selon que le système de conversion est

Complet lorsqu’il essaiera d’interpréter toute combinaison d'éléments de la source qui lui est présenté, même si elle n’est pas valide.

Partiel lorsqu’il contient une métrique capable de signaler qu’un ensemble d'éléments ne lui semble pas valide.

En pratique, un système de conversion multiélément est souvent partiel mais la frontière du rejet peut être mal définie ; elle est en effet souvent définie en fonction de la cible (c-à-d du résultat de la conversion) et non de la source, ce qui ne lui donne que peu de valeur opérationnelle (ainsi un système de reconnaissance de caractère ne marchera bien qui si on lui présente des caractères, ce qui n'aide pas vraiment à s'assurer qu'il est bien utilisé dans son domaine d'utilisation).

Un processus de conversion peut faire intervenir des éléments qui ne font pas partie du document proprement dit. Ces éléments d'environnement apportent des informations supplémentaires sur la façon de convertir un élément de la source en un élément de la cible. En général, ils décrivent au minimum la conversion des éléments de la base de la source en éléments de base de la destination. Ainsi, une police de caractère n'est pas d'habitude décrite dans le document.

30

Lorsque ces éléments d'environnements sont bien définis, le fait de ne pas les transmettre ne pose pas de problèmes d'appauvrissement particuliers. Par contre, il existe des cas où les éléments d'environnement qui guident le processus de conversion ne sont pas connus explicitement et en fait varient d'un document à l'autre. Ainsi, si un auteur pense son document en terme de chapitres et de paragraphes et qu'il effectue une conversion mentale pour le représenter dans un système de description orienté 'ligne', il décidera lui-même comment il traduira la notion de chapitres et de paragraphes en sa mise en page. Deux personnes ayant le même texte structuré à représenter utiliseront sans doute différentes représentations, c-à-d deux conversions avec des 'styles' différents. Il sera pratiquement impossible de reconstituer la structure du texte à partir de la représentation 'ligne' qui doit être aussi considérée comme une représentation pauvre par rapport à la représentation riche structurée telle qu'elle se trouve dans la tête de l'auteur ou dans une représentation qui conserve explicitement la notion de chapitre et de paragraphe et y associe des informations de mise en page explicite.

1.7. Passage d’une représentation de document à une autre

Un même document peut avoir plusieurs représentations. En particulier, une représentation peut être l’appauvrissement d’une représentation plus riche.

Dans de nombreux cas, il est nécessaire de convertir une représentation dans une autre qui n’est pas plus riche ou plus pauvre mais qui est approximativement au même niveau de richesse. C’est le cas par exemple dans le cas de la conversion d’un document d’une représentation d’un traitement de texte à une représentation dans le format interne d’un autre traitement de texte.

Dans la conversion d'un format de document d'une description riche à une description plus pauvre, il suffit de définir la conversion des éléments de base de la description riche. Chaque élément du document à convertir peut alors être pris en séquence et transformé en éléments de base de la description pauvre. Lors de la conversion de deux représentations d'un document supposé être représenté avec le même niveau de richesse descriptive, il faut aussi en principe transformer chaque élément de base de la description source en un ou plusieurs éléments de base de la description cible. Pour éviter un appauvrissement, il faut en principe que la transformation d’un élément de base de la source donne lieu à un élément de base dans la destination, ou autrement dit qu’il y ait une correspondance unique entre élément de base de la source et élément de base de la destination.

Les problèmes qui peuvent se poser dans cette conversion sont les suivants :

31

Certains éléments de base du système source peuvent ne pas avoir d'éléments de base correspondant dans le système de destination. Ainsi, on peut avoir un système source qui supporte la notion de tableau alors que le système de destination ne le supporte pas. Il se peut alors que la conversion de l'élément de base de la source soit absolument impossible. Il se peut aussi qu'elle soit possible mais à condition de traduire un élément de base de la source en plusieurs éléments de base de la destination, c-à-d à condition d’appauvrir la représentation du document. Dans le cas de la conversion d'un tableau, on convertira la représentation de la source en une série de caractères et de lignes dans la destination (en utilisant si nécessaire des tabulations) de façon à représenter approximativement ce tableau.

Certains éléments de base du système source peuvent avoir un élément de base correspondant dans le système de destination mais la structure des deux éléments de base peut être très différente d'un système à l'autre (il s'agit en fait d'un cas particulier du cas précédent). Ainsi, la notion de tableau peut exister comme élément de base dans les deux descriptions, mais un tableau peut être vu comme une structure matricielle dans un des cas et comme une structure linéaire (des lignes séparées par exemple par des tabulations) dans un autre cas. La conversion sera possible si la représentation à convertir est la plus structurée (c-à-d la plus riche) mais elle sera plus difficile dans l'autre cas. Ainsi, il sera facile de conversion une représentation matricielle en représentation par tabulation mais la conversion inverse sera plus difficile, ne serait ce parce que la notion de 'saut de ligne au sein d'une cellule' est perdue dans une représentation ligne par ligne.

Enfin, un cas très fréquent est celui où les deux représentations ont bien chacune tous les éléments de base en correspondance mais les éléments correspondants ne supportent pas les mêmes attributs. Ainsi, la notion de paragraphe peut exister dans deux traitements de texte mais la notion de paragraphe dans un des traitements de texte peut supporter un attribut qui donne l'indentation spéciale qu'a la première ligne alors que l'autre peut ne pas supporter cet attribut. Il est souvent possible de contourner le problème au niveau de la conversion mais pas nécessairement sans dégradation de l'information. Dans le cas de l'absence de la notion d'indentation de la première ligne dans la destination, si un paragraphe a une indentation négative pour la première ligne, on pourra par exemple ajouter un blanc négatif au début de la première ligne de chaque paragraphe (si cette notion existe) ou élargir le paragraphe de la quantité correspondante au retrait de la première ligne et ajouter des blancs correspondants pour toutes les autres lignes du paragraphe... Une solution très dégradante en ce qui concerne le niveau de richesse d'une description.

Bien entendu, la conversion ne pose problème que pour les éléments de base effectivement utilisés dans le texte à convertir. Si on un texte ne comprend pas de tableaux, il importe peu que la conversion soit ou non possible.

32

Lors de la conversion, l’appauvrissement sera d'autant plus important que les éléments de base de la source qui sont utilisé dans le document à convertir sont différents des éléments de base correspondant dans la représentation de destination. De façon générale, si un élément n'a pas de correspondant, il faut le transformer en une représentation plus pauvre (c-à-d basé sur un plus grand nombre d’éléments de base) existant dans la destination. A la limite, si la destination supporte une représentation 'pixel', il est toujours possible de transformer en ‘pixel’ l'élément de base de la source que l'on ne sait pas facilement convertir autrement. Comme on le verra au chapitre suivant, en général, on souhaite ne pas avoir d’appauvrissement lors d’une conversion de document.

L'observation que l’appauvrissement d’une représentation lors d’une conversion provient de ce que certains éléments de base utilisés dans le document source n'ont pas de correspondant dans la destination amène à faire les constatations suivantes :

Lors de périodes de forte évolution des représentations (par exemple, lorsque de nouveaux concepts sont introduits dans les traitements de texte), les conversions entre deux représentations différentes (deux formats ‘traitement de texte’ différents) sont plus appauvrissants. En effet à ces moments, on se trouve avec une population mixte d'anciens et de nouveaux outils supportant des descriptions de niveau de richesse très différent. Un bon exemple de cette époque est le début des années 1990 quand les traitements de texte sur mini qui supportaient mal des structures complexes comme les tableaux ainsi que des polices de caractères différentes et de taille arbitraire ont coexisté avec les traitements de texte PC. Il était possible de passer d'une représentation d’un traitement de texte 'pauvre' sur mini à un traitement de texte 'riche' sur PC, mais bien sûr les nouvelles possibilités étaient inexploitables. Ainsi un tableau dans la représentation ‘traitement de texte sur mini’ était transformé en une suite de lignes avec tabulation dans la représentation ‘traitement de texte sur PC’ et non dans la structure de tableau qui existait généralement dans ce dernier type de traitement de texte. La conversion inverse, d’une description ‘traitement de texte PC’ à une description ‘traitement de texte mini’ était ou n'était pas possible selon le caractère exotique des fonctionnalités utilisées dans document. Aujourd’hui, la plupart des traitements de texte supportent un ensemble d'éléments de base similaires et il est relativement facile de convertir un document d'un format traitement de texte à un autre format traitement de texte pour autant que celui-ci n'utilise pas des fonctionnalités trop exotiques. De même la plupart des logiciels de dessin vectoriels (voir les chapitres suivants) sont basés sur le même type d'éléments de base et pour des dessins de complexité moyenne, les conversions peuvent être faites sans appauvrissement.

Lors d’évolution de versions successives d’un outil de création de document (traitement de texte, tableur, logiciel de dessin), il est facile de passer d’une représentation de l’ancienne version à la représentation dans la nouvelle version sans appauvrissement. La conversion inverse n’est souvent possible que si le document de la nouvelle version n’a pas été créé en utilisant les possibilités nouvelles de la nouvelle version.

33

Pour assurer une conversion entre deux représentations différentes en gardant le même niveau de richesse, il faut limiter l'utilisation des éléments de base dans les documents à convertir. Si l'on sait que des documents doivent être convertis, il faut donc donner une liste des fonctionnalités que l'on peut utiliser, ou mieux, définir un «style» de document. Ce style sera défini en définissant des structures standards dont on sait qu’elles sont convertibles, telles que des paragraphes, des éléments de liste et des titres de différents niveaux. Ces styles seront d’usage obligatoire. Une telle approche facilitera la conversion et permettra surtout d'obtenir un style homogène pour tous les documents de l'entreprise.

1.8. Propriétés des documents riches et des documents pauvres

Lors d’un appauvrissement de représentation d’un document, un élément de base est transformé en plusieurs éléments de base. De façon générale, une représentation pauvre comprendra donc plus d’éléments de base qu’une représentation riche. Par contre, en règle générale, les éléments de base d’une représentation riche seront plus spécialisés et plus complexes, c-à-d avec plus de paramètres. De ces observations, on peut déduire les conséquences suivantes :

Une description riche demandera donc, en général moins de données qu'une description pauvre équivalente. En effet, il faudra moins d’éléments de base dans la description riche que dans la description pauvre équivalente. Même si le nombre de paramètres associés à chaque élément de base est plus élevé, le résultat global est qu'un document prend normalement moins d'espace dans une description riche que dans une description pauvre. Bien entendu, des techniques de compression permettent de réduire la différence en volume entre représentation riche et représentation pauvre.

Une représentation pauvre sera basée sur des éléments de base moins spécialisés. Elle sera donc plus générale et permettra de représenter une plus large gamme de documents qu'une représentation riche. Les descriptions pauvres sont donc fort utiles lorsque l'on veut représenter une large gamme de types de documents au moyen d'un format unique.

Les outils capables de restituer visuellement un document (écrans ou imprimantes) ne sont capables que de faire des opérations très simples (afficher un pixel à un endroit pour les outils récent, afficher des caractères pour des outils plus anciens) c-à-d ne n’exploiter que des représentations basées sur des éléments de base simples et très généraux (ce qui leur permet de restituer visuellement une large gamme de document). Pour restituer visuellement un document, il faut donc une représentation pauvre.

Si l’on souhaite éditer (créer ou modifier) un document, il est souhaitable, pour des raisons d’efficacité de n’avoir à créer ou modifier qu’un nombre minimum d’éléments de base. Cela signifie qu’il faut des documents comprenant très peu d’éléments de base c-à-d des représentations riches.

On voit donc le problème essentiel auquel doit faire face la bureautique ; la création et la modification des documents doivent se faire au niveau de richesse le plus élevé alors que la restitution (affichage et impression) doit ‘in fine’ se faire au niveau de richesse le plus faible. L’objectif de la chaîne bureautique est de réconcilier ces deux objectifs et en particulier de maintenir à chaque endroit et à chaque instant le niveau de richesse adéquat.

34

On peut illustrer les points mentionnés ci-dessus :

Un texte en format 'traitement de texte' occupera moins de place qu'un texte en format 'FAX' non compressé. Un format ‘traitement de texte’ permet juste de représenter du texte (si on suppose que le traitement de texte n’est pas multimédia) alors qu'un format FAX permet de représenter des textes mais aussi des dessins ou des graphiques.

De la même façon un fichier MIDI (semblable à une partition) est nettement moins volumineux qu'un fichier WAV (semblable à un enregistrement) généré à partir de celui-ci. Un fichier MIDI permet l’édition musicale, ce que ne permet pas le fichier WAV. Un fichier WAV permettra cependant d’enregistrer des paroles, ce que ne permettra pas un fichier WAV.

Parfois une description pauvre peut être peu volumineuse parce que chaque élément de base a peu de paramètres et que la représentation de certains documents ne demande pas trop d’éléments de base. Ainsi description 'mode ligne' sans attributs sera moins volumineuse que la représentation ‘traitement de texte’ correspondante. Dans ce cas cependant, la description appauvrie ne permet pas d'exprimer tous les documents qu'il est possible d'exprimer dans la description riche.

Comme une description pauvre est basée sur des éléments de base simples et qu'elle est souvent capable de représenter des types de documents fort variés, elle est souvent plus facile à standardiser qu'une description riche. D'une part l’intérêt d'une telle standardisation est fortement ressenti puisque cette représentation s'applique à un grand nombre de documents. D'autre part, il est plus facile de se mettre d'accord sur un standard de représentation puisque le nombre d'éléments de base est limité et que ceux-ci sont peu complexes. C'est ainsi qu'il a été assez simple de définir un standard international effectivement utilisé pour représenter des documents numérisés (scannés) (comme dans le standard FAX). Les langages d'impression tel que Postscript ou HP-PCL se sont aussi facilement standardisés, d'autant plus qu'ils sont nécessaires pour pouvoir imprimer un document et qu’ils ont donc pu être imposés par les fabricants d’imprimantes. Des formats simples tel que l'ASCII ou le RTF (Rich Text Format qui, contrairement à son nom est un format assez pauvre) sont aussi fort répandus.

Un standard qui était aussi pauvre, du moins à l’origine était le HTML. Il s’est enrichi progressivement, au rythme de ses différentes versions. Il devient cependant de plus en plus difficile pour les acteurs du marché de se mettre d’accord sur de nouvelles extensions.

De même, il n'a jamais été possible de se mettre d'accord sur un standard de description type 'traitement de texte' qui soit effectivement implémenté dans des produits commerciaux réellement utilisés. Il y a 10 ans, des efforts ont été faits pour définir une norme appelée ODA (Office Document Architecture) mais celle-ci, était trop générale et donc ne définissait pas réellement un format précis de document. Elle était aussi très complexe et elle n'a jamais été implémentée en pratique dans des produits commerciaux. Reconnaissant ces problèmes, la standardisation s’est tournée vers les méta-langage tel que SGML (Standard Generalized Markup Language) et plus récemment XML (eXtensible Markup Language). Ces efforts sont décrits plus loin.

35

Une représentation riche peut être convertie en une représentation plus pauvre. Cela signifie que toute opération qui porte sur une représentation pauvre, peut aussi être utilisée sur une représentation plus riche (pour autant que cette opération ne rende pas le document non représentable dans la représentation riche). Ainsi, si une représentation pauvre permet l’affichage, une représentation riche qui peut être convertie dans cette représentation pauvre peut aussi être affichée. Par contre, certaines opérations peuvent ne s’appliquer qu’à la représentation riche et pas à la représentation pauvre. Ainsi, la possibilité d’insérer un nouveau paragraphe ou d’indexer le document selon la liste des mots qu’il contient, n’est évidemment pas facilement implémentable dans une représentation ‘pixel’, alors que ces opérations sont souvent assez faciles à mettre en œuvre dans les représentations plus riches.

Une différence mentionnée dans la représentation des documents est la différence entre une représentation ‘déclarative’ et une représentation ‘procédurale’. Une représentation déclarative se contente d'enregistrer un texte en énumérant une série d'éléments de base et leur propriété. C’est donc essentiellement une structure de donnée. Une représentation procédurale se base sur la définition d'un ensemble d'opérateurs capables de générer les éléments de base et leurs paramètres. C’est donc en fait un programme. Ainsi si un document 'pixel' est d'habitude décrit de façon déclarative comme une matrice de points noirs et blancs, il existe aussi une description procédurale qui consisterait à donner des ordres pour écrire les points noirs. De même, une approche segmentée ou par ligne peut aussi être décrite en donnant les ordres pour écrire les segments ou les lignes. La différence entre les deux approches est importante :

Dans une approche déclarative, on a une structure de donnée qui n'a donc pas de 'sens' de lecture (même si sa représentation dans une structure linéaire telle un fichier impose de lire le fichier selon un algorithme de lecture).

Par opposition, une description procédurale étant une suite d'actions consécutives dans le temps, la lecture de la description doit être faite comme celle d'un programme c-à-d en suivant le flux des actions. Un bon exemple de représentation procédurale d'un texte est par exemple la dictée de ce texte par une personne dans un dictaphone. Il s'agit bien d'un 'document' mais tant que les actions n'ont pas été exécutées par un processeur (ici humain), pour transformer cette représentation en une représentation déclarative 'papier' (par exemple), il est difficile de l'exploiter en pratique.

Une description déclarative décrit le document, alors qu’une description procédurale décrit comment créer le document. L’appauvrissement d’une représentation déclarative se fera en transformant chaque élément de base en éléments plus nombreux et plus simples. L’appauvrissement d’une représentation procédurale se fera en décomposant les opérateurs générant les éléments de base en opérateurs plus simples.

36

Une représentation procédurale étant un programme, il sera difficile de la manipuler. Par contre, une représentation procédurale se prête bien à la commande d’un outil de restitution (affichage ou impression). En général, il est possible de passer d’une description déclarative en description procédurale et réciproquement. La transformation est appauvrissante si à un élément d’une des descriptions correspond plusieurs éléments dans l’autre description (par exemple la transformation d’un élément de base déclaratif en plusieurs opérateurs est appauvrissante, de même que la transformation d’un opérateur en plusieurs éléments de base).

Il faut aussi noter que la frontière entre description procédurale et description déclarative n'est pas tout à fait nette. Certains 'langages de commande' qui ont donc une orientation plutôt procédurale peuvent aussi être vus comme des 'langages de marquage' assez déclaratifs.

1.9. D’autres documents que les documents textuels

Le chapitre précédent a décrit les différentes descriptions d'un document purement textuel. Dans la pratique, un document peut contenir autre chose que du texte. Il peut contenir des tableaux, de l'image, des graphiques, des dessins, du son voire des animations vidéo.

Tous ces types de contenus peuvent être aussi représentés à des niveaux de richesse différents conformément à la discussion du chapitre précédent. Ainsi, un graphique tel qu'un histogramme peut être décrit

Comme une fonction mathématique discrète liant des valeurs à d'autres valeurs. Dans cette description, l'histogramme n'est autre que la représentation d'un tableau de chiffre à deux colonnes. Ce tableau de chiffre peut lui-même est le résultat d'une opération plus complexe comme l'extraction de valeurs d'une base de données relationnelle.

Un histogramme peut aussi être donc vu comme une série de bâtonnet de largeur fixe, ayant chacun une abscisse par rapport à une droite horizontale et une hauteur. Cette description est presque équivalente à la définition 'tableau' et la conversion de la représentation «tableau» à la représentation «histogramme» est pratiquement non appauvrissante.

Un histogramme peut être vu comme une série de rectangle de taille donnée et de position donnée dans la page. La description est moins structurée, et il sera plus difficile de passer de cette description à la précédente (quoique dans une partie de texte dont on sait qu'elle représente un histogramme, la conversion entre les rectangles formant les bâtonnets de l'histogramme et un tableau de chiffre ne serait pas trop complexe, à condition qu'il n'y ait rien d'autre dans l'histogramme qui soit aussi décrit comme un rectangle (comme l'encadré d'un titre)).

Un histogramme non colorié peut être vu comme une série de droites...

... et qu'il soit colorié ou non il peut être vu comme une série de points. A ce stade là, il devient difficile d'exploiter l'histogramme pour autre chose qu'une impression.

37

De même une annotation vocale possède-t-elle aussi plusieurs niveaux de richesse possible.

Au départ, le texte peut être disponible comme une série de mots décrit dans un alphabet normal ou phonétique (bien que ce ne soit pas habituellement le cas).

Ensuite, il peut être transformé automatiquement en son par un système de synthèse vocal exploitant une information d'environnement particulièrement riche. A ce moment, il devient très difficile de faire le travail inverse de reconstitution du texte en mots à partir du résultat de la synthèse vocale.

Un autre bon exemple de niveau de richesse différent dans le domaine sonore est la différence entre une représentation 'orientée instrument' et une représentation 'orientée son'.

Une partition contient une description structurée d'un morceau de musique. Cette représentation est compacte et fait appel pour sa traduction en son à un environnement assez complexe. Cet environnement fait intervenir au moins 2 types de composants : un instrument de musique et un interprète. Il existe des représentations informatiques qui ont ce niveau de structuration (fichier MIDI) et qui décrivent à la fois la partition et "l'environnement de conversion".

Un disque de musique contient une description beaucoup moins structurée de la même information. Il correspond un autre type de représentation informatique (fichier WAV par exemple). Passer de la description partition ('MIDI') à la description disque ('WAV') est facile. La conversion inverse est-elle beaucoup plus difficile. Une représentation ‘WAV’ permet par contre de représenter n’importe quel son ou bruit.

Pour des documents autres que des documents purement textuels, l'édition consistera aussi à créer ou à modifier les documents. Dans le cas d'un agenda électronique, l’édition devra se faire au niveau des éléments de base que sont les jours et les plages horaires. Dans le cas d’extractions de bases de données relationnelle, l'édition consistera à modifier les données de la base (au moyen vraisemblablement d'un programme informatique). Dans l’édition de dessins, l'utilisateur devra être capable de modifier les éléments de base (rectangle, droite, ellipse ou courbe de Bézier) du dessin. Si un document contient une interprétation d'un morceau écrit pour un synthétiseur, l'édition doit consister à modifier la partition du synthétiseur. Enfin un document photographique doit permettre la retouche des photos pixel par pixel (ou la modification de l'équilibre global des couleurs).

1.10. Représentation objet et documents multimédias

Dans les chapitres précédents, l’accent a été mis sur la représentation du document. Selon la complexité des éléments de base, la représentation était plus ou moins riche.

38

Pour un utilisateur, le niveau de richesse est important parce que, comme mentionné précédemment, un document représenté à un niveau de richesse élevé supporte un plus grand nombre d’opérations, c-à-d qu’il peut être manipulé plus facilement par l’utilisateur. Outre les opérations de restitution de base (affichage et impression), un document plus riche pourra selon le cas être édité (modifié), indexé ou analysé automatiquement par un programme pour en extraire et utiliser l’information.

Il est donc intéressant de considérer un document comme un ensemble de données et un ensemble d’opérations qui peuvent être faites sur ces données. Cette approche intégrée «donnée»-«opération» est appelée une approche «objet». La caractéristiques de toutes les approches «objet» est en effet de ne pas s’intéresser à la représentation des informations mais bien à l’accès à l’information au moyen d’un certains nombre d’opérations.

Cette notion d’approche «objet» va permettre de résoudre les problèmes posés par les documents «multimédias».

Un document «multimédia» est un document qui comprend du texte, des dessins, des photos, des graphiques voire du son ou des séquences vidéo. En principe, pour représenter des documents multimédias, il suffit de trouver des éléments de base, capables de représenter ses diverses parties.

Pour la restitution du document (affichage ou impression), un format pauvre peu convenir. En particulier, un format ‘pixel’ sera capable de représenter toute partie du document qui n’est pas variable avec le temps (texte, dessins, photos, graphiques).

Pour l’édition, par contre, il faudra utiliser un format le plus riche possible. Comme mentionné au chapitre précédent, la partie textuelle d’un document structuré en chapitre et paragraphe doit être éditée sur base de modification de ces éléments de base. La partie graphique d’un document devra être éditée en modifiant les données à l’origine du graphique. Les dessins doivent être édités en modifiant les éléments de base (rectangle, droite, ellipse ou courbe de Bézier) du dessin. L’outil capable d’éditer un document multimédia devra donc être capable d’effectuer toutes ces modifications et donc d’interpréter correctement tous ces éléments de base.

Construire un outil capable d’éditer un grand nombre de type de contenus différents (texte, graphique, dessin, tableau) pose plusieurs un certain nombre de problèmes. En effet, un outil unique permettant d’éditer ces différents types de contenu

Va être un logiciel très complexe à créer et à maintenir.

Ne va sans doute pas être le meilleur pour éditer certains types de contenus très spécialisés.

Suppose que le marché des éditeurs est dominé par un petit nombre de firmes capables de fournir des solutions complètes.

Sera difficilement extensible, dans le cas ou un nouveau type de contenu apparaît sur le marché.

Il y a plusieurs façons d’aborder ces problèmes :

39

Dans une certaine mesure, la plupart des éditeurs sont dans une certaine mesure 'multi-format'. Les traitements de texte permettent souvent d'éditer du texte, des tableaux et des dessins.

Une solution possible également consiste à permettre l'édition sur des niveaux de richesse plus faible. Les représentations sont alors plus homogènes et il est plus facile de faire des éditeurs généraux. C'est l'approche suivie par exemple en composition électronique où les documents sont réduits à une description assez pauvre qui est ensuite enrichie (souvent manuellement) via un éditeur particulier. Cette approche n’est souvent suivie que pour la composition de texte à des fins d’impression (desktop publishing) où il est souvent nécessaire de formater manuellement les documents afin d’avoir une homogénéité de style avant impression.

L'approche moderne est de permettre à plusieurs éditeurs développés par des firmes indépendantes de travailler chacun sur les morceaux de documents qu'ils sont capables de traiter de façon riche. Cette approche, qui est la seule réellement utilisable en toute généralité est soutenue par les 'architectures de documents composites' (c-à-d multimédia) telles que OLE (Object Linking and Embedding).

Dans ces architectures de document, un document est basé sur un ensemble d'éléments de base correspondant à un type de contenu donné. Parmi ses éléments de base, il existe un élément de base ‘Autre’ qui peut apparaître à divers endroits selon les règles d’emboîtements définies pour ce type de contenu.

Cet élément de base peut contenir n’importe quel type de contenu basé sur un ensemble tout à fait différent d’éléments de base. Lorsqu’un document contient effectivement une ou plusieurs occurrence de cet élément de base ‘Autre’, la partie du document qui ne correspond pas à ces éléments de base ‘Autre’ est appelée le 'Container' ou le ‘Client’. La partie contenue dans un élément de base ‘Autre’ est appelée une partie ‘Serveur’ ou ‘Objet’. Une partie ‘Objet’ d’un document est donc basée sur un ensemble d’éléments de base différents de la partie ‘Container’. La définition est récursive, en ce sens où une partie ‘Objet’ peut être ‘Container’ pour une sous partie contenant encore un autre type de contenu.

Ainsi un texte décrit sous forme de paragraphe et de chapitre contiendra aussi un élément appelé (par exemple) 'bloc'. Un ‘bloc’ correspond à l’élément de base ‘Autre’ mentionné ci-dessus. Il pourra contenir des tableaux de chiffres, des annotations vocales, des dessins, des figures. Un bloc aura dans la description toute une série de paramètres tel par exemple la largeur et la longueur du bloc, la possibilité pour celui-ci d'être coupé ou non par un saut de page et surtout une identification du système de description (l’ensemble des éléments de base) utilisé au sein du bloc.

Dans un document multimédia, il existe donc un container principal. La partie du document qui correspond à ce container principal correspond à un certain éditeur capable de générer des opérations sur cette partie du document. Cet éditeur permettra donc de créer ou de modifier le ‘container’.

40

L’éditeur capable d’éditer le container n’est pas capable d’éditer les parties ‘objet’ du document. Chaque partie ‘objet’ ne peut en effet n’être éditée que par un autre éditeur spécialisé. La clef de la solution au problème d’édition de documents multimédias est de permettre que l’éditeur du container soit capable d’interagir avec les éditeurs des objets de façon à ce que l’ensemble apparaisse à l’utilisateur comme un seul éditeur. Il faut donc que l’éditeur du container et l’éditeur d’un objet partagent un certain nombre de conventions générales permettant de régler leur interaction. Ces règles d’interaction ne dépendent pas du type de contenu ni du container, ni des objets. La spécification OLE de Microsoft est une spécification de telles règles d’interaction. Elles sont orientées ‘objet’ puisqu’elles ne voient les parties d’un document qu’au travers d’interactions entre les éditeurs (c-à-d les programmes) capables de manipuler ces différentes parties.

Ainsi un traitement de texte, lorsqu’il affiche une portion d’un texte effectuera l’affichage de la portion du texte appartenant au container pour lequel il est responsable. Lorsqu’il rencontre un bloc contenant un autre type de contenu, il demandera au programme capable de gérer l’objet qui est dans le bloc d’en effectuer la mise en page. Le container fournira à ce programme serveur certaines informations générales (par exemple des tailles maximales de bloc). Si, l'utilisateur demande d'éditer le contenu du bloc, le container laissera le programme ‘serveur’ gérant la partie ‘objet’ prendre temporairement le contrôle de l’interface. Grâce au suivi de certaines règles en matière d’interface, l’utilisateur n’aura pas l’impression (du moins en théorie) de quitter l’éditeur du container pour opérer avec l’éditeur de l’objet.

En réalité, l’interaction est un peu plus complexe de façon à permettre des temps de réponse acceptable et la possibilité d’afficher ou d’imprimer les parties ‘objet’, même si les éditeurs de ces parties ‘objets’ ne sont pas disponibles lors de l’affichage ou de l’impression. Une explication plus complète des mécanismes OLE est fournie dans un des chapitres suivants.

Une telle façon de traiter les documents multimédias est tout à fait générale et peut être utilisée pour créer des documents mélangeant des types d'information les plus variés. Ainsi, il sera possible à un traitement de texte de contenir des blocs contenant des tableaux, des dessins, des photos ou des annotations. Il sera même possible de placer des annotations vocales ou d’insérer des animations vidéo.

De même, il sera possible à un document 'container' de type 'tableau éditable par un tableur' de contenir, dans les cellules du tableau, des blocs contenant d'autres types d'informations tel que des dessins ou des extraits de bases de données.

Un 'container' de type 'dessin' permettra quant à lui de placer des blocs de type 'texte' ou 'photo'.

On notera que le container ne gère pas le contenu d’un objet. Par contre c’est le container qui détermine à quel niveau de sa description l'apparition d'un tel bloc est possible. Un traitement de texte particulier définira par exemple qu'un bloc peut apparaître là où un paragraphe est permis (alors qu'un autre permettra l'apparition d'un bloc là où un mot est permis). Un logiciel de dessin permettra un bloc là où pourrait apparaître un texte au sein du dessin.

41

1.11. Les représentations intéressantes

Il existe des multitudes de représentations de documents. Certaines sont publiques et d’autres sont privées, comme le sont le plus souvent les représentations internes au sein des outils bureautiques de base (traitement de texte, tableur, logiciel de dessin). Ce chapitre se focalise sur les représentations publiques les plus largement utilisées ou celles qui illustrent les difficultés rencontrées par le processus de standardisation.

A nouveau, il faut insister sur l’importance du niveau de richesse de représentation. Un document qui doit juste être imprimé, ne doit pas être représenté de la même façon qu’un document qui doit être échangé entre deux systèmes informatiques dans le cadre d’un traitement informatisé. Et donc la représentation d’une facture, par exemple, à des fins de simple impression, sera très différente de la représentation de la même facture échangée entre deux systèmes de comptabilité de deux firmes différentes visant à automatiser complètement le traitement de ces factures.

La standardisation des représentations obéit à certaines règles qui ont déjà été mentionnées partiellement auparavant :

La standardisation se focalise tout d’abord sur des représentations pauvres, plus simples à standardiser et s'appliquant à un plus grand nombre de document.

Au fur et à mesure que le temps passe, la standardisation s’intéresse à des représentations de plus en plus riches, c-à-d de plus en plus complexes, de plus en plus structurées et de plus en plus spécifiques à un domaine d’activité.

Pour rester possible, la standardisation des représentations riches est plus une standardisation de mécanismes de représentation que de représentations elle-même. On parle de standardisation de méta-représentation.

Avec l’évolution d’outils comme Internet, un document est devenu un objet à la fois beaucoup plus dynamique dans son contenu. Celui-ci a aussi perdu dans certain cas son aspect ‘local' (les données peuvent venir dynamiquement de bases de données distantes). On a donc un élargissement de la notion de document à la fois temporelle et spatiale.

Avant d’aborder le détail de différentes représentations, il est encore important de savoir ce que l’on standardise vraiment dans une représentation de document. Comme mentionné précédemment, toute représentation de document est basée sur un certain nombre d’éléments de base. La définition d’une représentation de document devra donc comprendre :

La liste des éléments de base permis.

La relation entre ces différents éléments de base (leur emboîtement possible ou encore la grammaire d’emboîtement de ces éléments de base).

42

Chapitre 3: Quelques représentations de documents

Les attributs ou les propriétés de chaque élément de base et leurs valeurs possibles. Eventuellement, la définition devra comprendre la définition des relations possibles entre les valeurs des différents attributs (par exemple que certaines valeurs pour des attributs différents sont non compatibles).

Enfin, les opérations qui seront possibles sur ces éléments de base et les résultats de telles opérations.

Ce dernier point est important. En particulier, pour des documents bureautiques destinés à être restitués sur un médium (affichage sur écran, impression, émission sonore via un haut-parleur), il est important de spécifier comment chaque élément de base peut être restitué en fonction de sa définition, de ses paramètres et des autres éléments de base qui l’entourent. Cette restitution est une opération de transformation (appauvrissante) en des éléments de base plus simples, ultimement de type ‘pixel’ ou ‘échantillon sonore’. Cette transformation doit être faite par un programme. Ce programme peut lui-même être plus ou moins spécifique.

Pour des représentations pauvres, les éléments de base sont très élémentaires (lignes, pixels, caractères) et le programme permettant la restitution est spécifique. Par contre, pour des éléments de base très spécifiques appartenant à des représentations riches très spécialisées (comme par exemple l’élément de base qui décrit la date de facturation pour une facture), il est intéressant de définir une façon simple de spécifier le programme de restitution. Il s’agit alors de standardisation de langages permettant de construire des ‘feuilles de style’. Ce point sera expliqué plus loin.

La description de différentes représentations dans les chapitres suivants aborde tout d’abord des représentations pauvres avant de décrire des représentations plus riches. Le chapitre se termine par l’examen de problèmes particuliers comme celui de la signature électronique et celui de la protection des contenus.

1.12. Une représentation orientée vers la restitution : Postscript

Postscript est une description qui a pour seule ambition la description de documents destinés à être restitués et plus particulièrement d’être imprimés. Postscript ne permet pas facilement l’édition (la modification) de documents.

L'étude détaillée de Postscript est intéressante à beaucoup d'égards :

Postscript est largement utilisé pour contrôler des imprimantes Laser. Avec les langages utilisés par Hewlett-Packard, il s'agit d'un standard 'de facto' en ce domaine. Il a été construit pour tenir compte des contraintes que pose l’impression sur ce type d’imprimantes (en terme de mémoire et de puissance de processeur limitée).

Postscript est à la base d'Acrobat, un standard pour représenter des documents 'portables' c-à-d qui peuvent être facilement afficher sur n'importe quelle plateforme. Acrobat permet aussi de faire des ‘copier-coller’ entre des portions de texte représentées en Acrobat et des traitements de texte. Il permet aussi d’indexer des textes. Acrobat est largement utilisé sur INTERNET pour échanger des documents à la mise en page complexe.

43

Postscript a été conçu pour permettre l’impression des documents indépendamment de leur échelle et de la résolution du système d'affichage. Un document Postscript s'affichera toujours 'le mieux possible' sur n'importe quel système d'affichage. Sa technologie a inspiré d'autres techniques telles les polices de caractères 'true type' dans le monde Windows qui sont définies indépendamment de la taille.

Postscript est très souple, puisqu'il permet de représenter efficacement n'importe quel document représentable sur du papier.

Enfin, l'approche technique utilisée par Postscript est surprenante et montre qu'un problème tel celui posé par la description d'un document peut être abordé de bien des façons.

Au point de vue technique, Postscript est un langage de programmation. C’est donc un exemple de représentation procédurale. Comme langage de programmation, il possède des types de base comme des strings (chaînes de caractère), des booléens ou des nombres. Il possède des types composés tels que les tableaux. Il possède aussi des opérateurs différents selon les types. Finalement, il possède aussi des procédures que l'on peut appeler en passant des paramètres.

Comme langage de programmation, Postscript a cependant quelques contraintes. Comme un programme Postscript est destiné à être généré par le traitement de texte sur un ordinateur et à être transmis sur le câble qui le relie à l’imprimante pour être interpréter par celle-ci, il devait être interprétable facilement par un outil de capacité limitée (l’imprimante) et devait être facilement généré par des outils tels le traitement de texte. Devant être envoyé sur un fil byte par byte, il devait être compact et donner lieu à une exécution dès la réception d’un byte (ou plus exactement d’un mot) de façon à ne pas saturer la mémoire de l'imprimante.

Toutes ces contraintes ont mené à définir Postscript comme un langage à pile (stack). Un interpréteur Postscript gère en fait 3 piles. Une pile va contenir les dictionnaires Postscript, c-à-d un empilement de références à des définitions de procédures. Une autre pile va contenir les opérations en cours. Une troisième pile va contenir des états de l'environnement graphique. Le langage travaille essentiellement grâce à des règles d'interprétation et de réécriture des objets qui se trouvent sur les différentes piles.

L’interpréteur lorsqu'il reçoit un mot cherche à le classer comme une chaîne de caractère, comme un nombre, comme un tableau, comme une définition de procédure ou comme un nom de procédure soit à stocker soit à exécuter. Cette classification se fait selon la typographie du mot reçu. Ainsi, si c'est un nombre, le mot reçu est interprété comme un nombre, si c'est une chaîne de caractère, elle commence par une parenthèse, si c'est un tableau, il commence par un '[', si c'est une définition de procédure elle commence par un '{', si c'est un nom à stocker, il commence par un '/' et dans les autres cas, ce doit être un nom de procédure à exécuter.

Si le mot rencontré est un nom à stocker, un nombre, une chaîne de caractère, un tableau ou une définition de procédure, il est mis sur la pile des opérations.

44

Si le mot rencontré est un nom de procédure à exécuter, la pile des dictionnaires est examinée pour identifier la procédure à exécuter. La procédure est soit une procédure 'codée' selon les opérations de base supportées par le système d'affichage ou définies par l'interpréteur pour son propre fonctionnement, soit c'est une procédure qui a été définie antérieurement par le 'programme' en cours d'interprétation comme une suite d'appel à d'autres procédures. Ces autres procédures sont alors exécutées en séquence.

La clef du système se trouve dans la définition des procédures de base. Elles sont définies dans un dictionnaire appelé 'systemdict'. On trouve les types de procédures suivantes :

Des procédures de calcul, tel que 'add' ou 'sub' qui prennent les éléments au sommet de la pile des opérations et les remplacent par un élément résultat de l'opération. Les opérateurs logiques tel 'and' et 'or' ou les opérateurs relationnels tels 'eq' (égal) ou 'ge' (greater or equal) sont aussi définis de la même façon.

Des procédures servant à définir le langage lui-même telles que 'defs' qui prend la définition de procédure au sommet de la pile des opérations et l'écrit dans le dictionnaire, 'if' qui exécute une procédure sous condition, 'for' qui exécute une procédure dans une boucle. Il existe aussi des procédures spécifiques de manipulation de tableau.

Des procédures qui servent à tracer des courbes tel 'moveto' qui bouge le curseur à un point courant, 'rlineto' qui trace une ligne, 'arc' qui trace une arc de cercle, 'curveto' qui trace une courbe de Bézier. On peut aussi changer la position, l'orientation ou la taille d'une courbe avant son tracé grâce à des procédures qui changent le système d'axe tel que 'translate' pour le déplacer, 'rotate' pour changer son orientation ou 'scale' pour le dilater.

Des procédures de gestion des dictionnaires.

Des procédures qui modifient l'état graphique tel 'setdash' qui modifie l'état des pointillés, 'setgray' qui change l'état du niveau de gris ou 'gsave' qui met l'état courant sur la pile de l'état de l'environnement graphique.

Des procédures de gestion de police de caractère tel 'scalefont' qui donne la taille d'une police ou 'definefont' qui permet de la définir.

Des procédures diverses tel 'showpage' qui imprime et ré-initialise la page courante.

Un programme Postscript est donc en fait construit en 'logique Polonaise inverse'. L'appel d'une procédure à exécuter est précédé de la mise sur la pile de ses arguments. Après son exécution, la procédure laisse sur la pile les résultats.

Ainsi, la procédure pour tracer un carré aura l'apparence suivante (on suppose que le stack comprend les coordonnées du carré ; ce carré sera d'une longueur de 10, puisqu'il est toujours possible de dilater ou de rétrécir les axes de référence avant son tracé pour obtenir un carré de taille voulue) :

45

/carre {

newpath % initialiser le tracé

moveto % prendre les 2 valeurs sur la pile, les retirer positionner le curseur

10 0 rlineto % mettre 10 puis 0 sur la pile puis appliquer rlineto qui positionne

% le curseur relativement en traçant le trait

0 10 rlineto % un autre côté

-10 0 rlineto % encore un autre

closepath % et fermer avec le quatrième côté

} def % et tout cela qui est sur la pile, le mettre dans le dictionnaire en

% l'associant au nom 'carré'.

Un programme générant un document va donc générer un tel programme Postscript. Ce programme sera interprété par le système d'affichage ou d’impression.

Postscript ne connaît que quelques figures de base. Une des plus intéressantes est la courbe de Bézier. C'est elle qui permet à Postscript de tracer des courbes de n'importe quelle forme qui passent par une série de points en assurant une bonne continuité entre les segments qui définissent la courbe. La courbe de Bézier a comme paramètre les coordonnées de 4 points (c-à-d qu'elle utilise la coordonnée du point courant et les 3 paires de coordonnées mise sur la pile des opérations). Elle part du premier point et arrive au quatrième. Elle est tangente au départ à la droite qui unit le premier et le deuxième point et est tangente à l'arrivée à la droite qui unit le troisième et le quatrième point. Elle est contenue entièrement dans le quadrilatère formé par les 4 points et elle obéit à une équation polynômique de degré 3. Les courbes de Bézier sont utilisées dans la plupart des logiciels de tracé de dessin.

La force de Postscript provient en grande partie de la possibilité de définir des procédures. Si un programme de dessin utilise par exemple fréquemment des quadrilatères ou des triangles, plutôt que de transmettre à l’imprimante une suite de bytes décrivant comment créer chaque forme effectivement utilisée, il sera possible de transmettre une procédure avec paramètre décrivant comment dessiner ces formes, et simplement d’appeler ces procédures avec les paramètres adéquats lorsque nécessaire. Cela permet de simplifier fortement le flux de bytes envoyés à l’imprimante, surtout si un programme manipule fréquemment des formes similaires.

Il faut noter que Postscript a donné lieu à des variantes tel que l'EPS (Encapsulated Postscript) qui permet de l'utiliser comme langage d'affichage général (et non plus seulement comme langage d’impàression). 'Acrobat', lui, est une simplification de Postscript. De plus ‘Acrobat’ déclaratif et non procédural. Il est plutôt orienté vers l'échange de documents affichables sur n'importe quel médium, mais contrairement à Postscript, il permet d’autres fonctions que la simple impression.

46

1.13. Polices de caractère

La plupart des descriptions textuelles s’expriment d’une façon ou une autre en terme de caractères. Le paramètre principal d’un caractère est son code. Le code permet d’identifier le caractère dans un alphabet.

Dans le passé, en informatique, il y avait deux codes dominants : l'EBCDIC pour les machines IBM et l'ASCII pour les autres systèmes. Avec le temps, l'ASCII est s’est imposé comme le code le plus général. Strictement parlant, l'ASCII est un code sur 7 bits qui permet donc de représenter 128 caractères. Dans ces 128 caractères, 33 codes sont réservés pour des codes de commandes ('return', 'delete', 'escape', 'saut de page') et 1 code permet de représenter l'espace blanc. Il reste donc 94 codes qui permettent essentiellement de coder les chiffres, les caractères alphabétiques majuscules et minuscules non accentués, les signes de ponctuation et quelques caractères spéciaux.

Le code ASCII de base ne permettait pas de représenter des lettres accentuées. Le code ASCII a donc été étendu pour en permettre la représentation.

Certaines solutions étaient basées sur l'usage d'accents dits flottants, c-à-d que les caractères accentués étaient formés de plus d'un caractère (souvent l'accent suivi du caractère). Cette approche avait comme avantage de ne pas nécessiter la création de nouveau codes. Par contre, elle avait comme inconvénient de rendre différente la taille 'logique' d'un mot (en nombre de caractères) de sa taille 'physique' et donc de rendre plus complexe la gestion mémoire.

Une alternative a donc été d'étendre le code ASCII pour le transformer en un code sur 8 bits. Les 128 nouveaux codes disponibles ont été gérés de la même façon que les 128 codes de poids les plus faibles et donc en pratique, 94 nouveaux codes ont pu être définis. Une norme, assez complexe (ISO 6429) a défini l'utilisation de ces nouveaux codes de façon à pouvoir y placer plusieurs jeux de caractères. Cela avait pour objectif de résoudre non seulement le problème des lettres accentuées mais aussi le problème des jeux de caractères non latins (grec, arabe, cyrillique, hébreux, thaï...). Un jeu de séquence de désignation puis d'invocation permettait de définir les codes qui étaient placés dans la partie haute de la table de code (code de 128 à 255) puis de les utiliser. L'utilisation de ces mécanismes pour représenter un texte n'est pas facile parce que l'interprétation d'un caractère dépend de la séquence de désignation et d'invocation placée éventuellement à un endroit arbitraire précédent le caractère.

Aussi, en pratique n'utilise-t-on pas les mécanismes de désignation et d'invocation. On utilise directement une norme de type ISO8859 qui définit de façon statique pour un texte l'utilisation des codes situés au-dessus de 128. Cette norme a des variantes comme par exemple ISO8859/1qui permet de coder toutes les langues d'Europe de l'Ouest basées sur un alphabet latin, ISO 8859/2 qui permet de coder toutes les autres langues utilisant un alphabet latin (turc, tchèque etc...), ISO 8859/4 qui permet de coder le cyrillique et ISO 8859/7 qui permet de coder le Grec moderne. Cette solution ne marche que pour des textes homogènes c-à-d qui ne comprennent qu'une seule langue plus éventuellement l'anglais. Si on doit coder des textes multilingues, il y a 2 solutions :

47

Utiliser différentes polices de caractères (voir ci-dessous). On utilise simultanément les différents codes des normes ISO 8859 et on utilise les polices de caractères qui se rapportent au type d’alphabet effectivement utilisé dans cette portion de texte. Le problème de cette solution est tout d'abord de définir uniformément l'ensemble des polices de caractère à utiliser. Et ensuite le problème est que les polices de caractère sont utilisées à des fins qui ne sont pas les leur. Il devient difficile d'indexer un texte avec des mots clefs, d'utiliser un correcteur orthographique ou tout simplement de faire du 'couper/coller'.

Utiliser un jeu de caractère codé sur 16 bits. Il existe maintenant une norme appelée UNICODE permettant de coder la plupart des langues, y compris les langues orientales telles le japonais ou le coréen. Cette norme a l’inconvénient de réclamer plus d’espace de stockage pour les textes mais par contre d’être une solution ‘propre’ aux problèmes de codage multilingue. Son adoption dans NT4 et la version 97 de Word et la nécessité de trouver une solution satisfaisante pour traiter les langues Orientales (ou se trouvent des marchés en expansion) l’a transformé en solution universelle.

L’élément de base ‘caractère’ outre son code, appartient aussi à une police de caractère. Une police de caractère est la spécification de la représentation de chaque caractère d’un alphabet. Cette description n'est pas d'habitude jointe au texte (il y a des exceptions comme lorsque des documents sont produits avec certains logiciels de dessin). Il y a plusieurs raisons à cela :

Les polices de caractères sont la transformation des éléments de base d'une représentation (les caractères) en une représentation basée sur d'autres éléments de base (courbes ou points). Comme déjà mentionné, en règle générale, on ne transmet pas la définition des éléments de base avec un document.

Les polices de caractères sont antérieures à l'informatique. Il s'agissait alors de formes coulées en plomb. Elles portent des noms qui ont été enregistrés et chaque imprimerie qui utilise une police paie indirectement des droits à l'auteur de cette police. Il en est de même en informatique. Les polices de caractère informatique sont soumises aux même règles ; l'utilisation d'une police dans un logiciel informatique donne lieu à paiement de droit. 'Copier' une police chez quelqu'un qui ne la possède pas et n'a pas payé les droits est une opération illégale.

La description d'une police dépendra de la structure du système d'affichage. Une même police aura une description par système d'affichage.

Le découplage de la représentation des caractères (via des polices dont la définition n'accompagne pas le texte) pose le problème sur ce qu'il convient de faire lorsque la police de caractère utilisée dans le texte n'existe pas dans la structure d'affichage. Cela était très souvent le cas dans le passé lorsque la police de caractère était liée physiquement à la structure d'affichage. En effet il y a quelques années, la définition de la police de caractère se faisait en fonction d'une description directement 'pixel' que ce soit dans le cas de la police de caractère supportée par un terminal ou une imprimante. Or toute police de caractère, lorsqu'elle est définie directement par une matrice de points, n'est pas re-dimensionnable c-à-d qu'il faut une définition pour chaque taille de caractère. Il était donc très fréquent que la police nécessaire ne soit pas présente.

48

Aujourd'hui, le problème est moins aigu, parce que la définition des polices de caractères au niveau du système d'exploitation permet d'assurer que les mêmes polices sont disponibles tant au niveau de l'affichage terminal qu'au niveau de l'imprimante. De plus, la définition des polices en terme de contours de lignes permet d'assurer qu'elles sont re-dimensionnables. Une seule description de chaque caractère convient donc quelle que soit la taille des caractères. Enfin la définition est liée au système de commande d'imprimante et non plus à une imprimante particulière. Il n'est donc pas nécessaire de veiller à ce que chaque imprimante ait l'ensemble des polices nécessaires mais simplement que les langages de commande d'un type d'imprimante particulier supportent les polices nécessaires (ainsi, lorsque l'on emploie une imprimante 'deskjet', ce que l'on envoie à l'imprimante est une description plus ou moins 'pixel' de la page, générée par l'ordinateur, au départ des polices de caractère disponibles pour le système d'affichage ; il n'est même plus nécessaire que l'imprimante en elle-même supporte une seule police).

On notera que si une police n'est pas disponible, il est très difficile de trouver une police de substitution, surtout si la police est proportionnelle. En effet, l'espace entre les caractères dépend de la police et le remplacement d'une police par une autre, même de taille identique, fera en général perdre des propriétés telles que la justification. Dans certains cas aussi, le nombre de caractères que l'on peut mettre sur une ligne dépassera la taille de la ligne lorsqu'on utilise une police de substitution.

Les polices de caractères ont toute une série d'attributs qui ont été définis du temps de leur utilisation par les imprimeurs. Ainsi, les polices se divisent en polices proportionnelles où chaque caractère a une taille variable et en police non proportionnelle où chaque caractère a une taille fixe. La taille d'un caractère est exprimée par sa hauteur qui est exprimée en points PICA où un point vaut 0,03527 centimètres. Comme cela est bien connu, les caractères sont souvent disponibles en version grasse, italique et soulignée. Le 'gras' est lié à l'épaisseur du trait, l'italique à l'inclinaison du caractère par rapport à l'horizontale. Certaines polices de caractères sont qualifiées de police 'sérif', d'autres de polices 'sans-sérif'. La distinction se réfère à la façon dont sont terminés les caractères. Certains couples de caractères d'une police supportent le kerning dans lequel l'espace blanc entre certains couples de caractères est modifié pour que la mise en page des caractères soit plus élégante. Toutes ces notions viennent directement de la typographie.

1.14. HTML

HTML (HyperText Markup Language) est un format de représentation assez pauvre, directement dérivé des langages de marquages utilisés sur les ‘mainframes’ des années 1980.

Formellement HTML est une grammaire particulière du SGML (Standard Generalized Markup Language), un standard de marquage qui est expliqué plus loin. Comme dans la plupart des langages de marquage, un texte marqué HTML contient des balises qui en structurent le contenu. Une balise est une chaîne de caractère usuellement encadrée par le caractère ‘<’ en début de chaîne et le caractère ‘>’ en fin de chaîne.

49

Il est existe en général deux types de balises. Les balises de début de marquage et les balises de fin de marquage. Les deux types de balise commencent toutes les deux par une chaîne de caractères alphanumériques qui identifie la balise. Une balise de début de marquage est identifiée par le caractère ‘<’ suivi de l’identificateur de la balise. Une balise de fin de marquage est identifiée par les caractères ‘</’ suivi de l’identificateur de la balise. Toute balise de fin de marquage est toujours associée à une balise de début de marquage, mais l’inverse n’est pas vrai, une balise de début de marquage peut ne pas être suivie d’une balise de fin de marquage. Outre l’identificateur de la balise, une balise de début de marquage peut contenir une série d’attributs, généralement énoncés sous la forme ‘attribut’=’valeur’ (parfois, la valeur de l’attribut suffit).

Ainsi un exemple de texte marqué avec attribut sera :

<PRE WIDTH=56>

NOM TELEPHONE

BERTRAND 12345

GARANT 54321

</PRE>

Dans cet exemple, le tableau depuis ‘NOM’ jusque ‘54321’ est marqué par la balise ‘PRE’. Cette balise a un attribut ‘WIDTH’ qui a, dans ce cas-ci, la valeur 56.

HTML a eu de nombreuses évolution depuis sa vie pourtant assez récente, mais toutes ces évolutions ont confirmé son rôle de représentation de document à un niveau assez physique c-à-d assez pauvre. De plus, initialement, le nombre de balises reconnues était assez réduit et la richesse de mise en page des textes était assez limitée.

Les balises principales de HTML sont :

Les balises générales de structuration de document telles que <HTML>, la balise encadrant l’ensemble du document, <TITLE> la balise définissant les titres, ou <H1>, <H2>…, les entêtes de niveaux. La structuration du texte peut aussi s’appuyer sur <UL> et <LI> qui définissent une liste et ses éléments et la balise <P> qui crée des ruptures de paragraphe.

Les balises créant des structurations complexes telles que <FORM> qui crée des formulaires en collaboration avec la balise <INPUT> qui spécifie les informations relatives à chaque champ et notamment son type (CHECKBOX, RADIO). Ces formulaires (ou des balises plus simples comme ISINDEX) permettent au lecteur du document de le compléter en y introduisant de l’information à des endroits précis. Cette information peut être envoyée chez le responsable de la fourniture de la page. D’autres balises telles que les <FRAME> permettent de structurer une page de document en cadres plus ou moins indépendants.

50

Les balises modifiant le style du texte telles que <I> pour l’italique, <KBD> pour des caractères de type ‘machine à écrire’ ou <STRONG> pour du texte renforcé.

La balise <IMG> qui permet de référencer une image contenue dans un fichier indépendant (et dont la location est fournie comme attribut ‘SRC’).

Outre ces balises de mises en page, HTML définit encore des balises spécialisées telles que

<A> et <LINK> qui permettent, à partir d’un document, de référencer un autre document ou un point à l’intérieur du même document. La référence entre documents différents se fait en donnant comme valeur à l’attribut ‘HREF’ la localisation du fichier. L’utilisation courante de ces balises est de permettre à l’utilisateur de naviguer dans le document ou à travers un réseau de documents (WEB). Ce réseau peut être local à une machine ou il peut être un réseau de documents liés sur des machines différentes situées à des endroits très différents et appartenant ou non à la même organisation. Ces ‘Internet’, ‘Extranet’ et ‘Intranet’ sont décrits plus loin dans ce livre.

Des balises spécialisées telles que <APP> ou <OBJECT> ou <SCRIPT> qui permettent de placer des morceaux de codes ou des ‘objets’ complexes dans des documents.

On voit donc que HTML est une représentation de document paradoxale. D’une part, elle est très simple, très physique et pas très riche et d’autre part, elle permet des hyperliens ou l’exécution de morceau de code dans la page. Bien entendu, cette spécificité du langage HTML s’explique principalement par son origine de syntaxe universelle de description de documents sur le WEB.

1.15. ODA ou la recherche du format universel

1.15.1. Un objectif ambitieux

Avant d’examiner des langages de marquages plus généraux tel que SGML ou XML, il est intéressant de s’intéresser à une norme ISO qui n’a pratiquement jamais été utilisée : la norme ISO dite ODA (Office Document Architecture).

L'objectif de cette norme était d'arriver à un accord sur un principe général de description de documents bureautiques, puis de créer des grands types de documents et d'arriver ainsi à une représentation standard de documents permettant l'échange entre des traitements de texte différents.

51

Bien que la norme ODA n'ait jamais réussi à s'imposer à cause probablement de l'impossibilité de définir ce qu'est 'une' description de document bureautique, il est intéressant d'en faire une étude brève afin de réaliser les problèmes qu'elle a abordés et la façon dont elle entendait les résoudre (pour mémoire, la norme était déjà en chantier mi-1985 et bien sûr elle a essayé de s'adapter aux différentes évolutions en matière de bureautique survenues depuis cette époque). Cette évolution est d’autant plus intéressante que les efforts récents autour de XML et XSL, décrits dans le chapitre suivant présentent bien des similitudes avec les efforts entrepris par les concepteurs d’ODA.

1.15.2. Les principes de base

La norme part de quelques principes généraux :

Il est illusoire de vouloir définir de façon générale une structure 'logique' standard d'un document qui s'appliquerait à n'importe quel document. Tout ce que l'on peut dire en ce qui concerne la structuration logique d’un document est qu'un document est 'logiquement' une structure hiérarchique.

Par contre, il est possible de définir précisément la représentation physique d'un document, c-à-d sa mise en page. La norme peut donc proposer une structure précise pour la mise en page.

Toute description, qu'elle soit 'logique' ou 'physique' doit s'arrêter à un niveau appelé 'bloc' qui contient un contenu d’un certain type: texte, tableau, dessin, photo.

La norme remarque qu'un document possède au moins 2 descriptions : la description logique dite 'révisable' et la description physique qui est celle de la mise en page. En un certain sens, elle reconnaît au document au minimum deux représentations de niveau de richesse différent dont elle entend coordonner la relation. Cette coordination consiste à définir le processus de mise en page, c-à-d la façon de passer de la description logique à la description physique.

Dans chaque représentation, le document est représenté par un emboîtement de structures. Chacune de ces structures, qu’elle soit logique ou physique, possède un ensemble d'attributs dont la norme standardise la définition et les valeurs possibles.

La norme suppose que les blocs ont la même description dans la structure logique et dans la structure physique. Leur description est donc partagée entre les deux types de représentation (c'est probablement une des faiblesses de la norme).

La norme remarque aussi que certaines parties de la structure logique ou de la structure physique se retrouvent répétées de façon identique à plusieurs endroits. Ces parties communes sont placées dans une structure générique physique ou logique.

52

Enfin, la norme observe aussi que la structuration des documents doit obéir à une grammaire obligatoire qui décrit les emboîtements permis de structures logiques ou de structures physiques ; cette grammaire peut aussi être décrite dans une structure générique. La norme ne rend cependant pas obligatoire cette grammaire.

1.15.3. La représentation de la structure logique d’un document

La norme ODA permet donc d'exprimer une structure logique du document qui est censée représenter le document sous sa forme ‘révisable’, c-à-d dans une représentation de niveau de richesse comparable au niveau de richesse d’une représentation interne ‘traitement de texte’. La norme n’est pas très spécifique sur cette représentation. Elle affirme seulement que cette structure est une hiérarchie. Cette hiérarchie représentera par exemple, la suite des chapitres, paragraphes, et blocs qui composent un document. Cette hiérarchie est une hiérarchie de composition. Elle décrit l'ordre 'logique' de succession des éléments d'un document précis.

La description logique définie par la norme est donc tout à fait générale. Pour tenter de la concrétiser et surtout de permettre la définition de types de documents, la norme permet de définir une structure générique logique qui va contraindre la structure du document. Celle-ci permet de définir des contraintes que doit respecter le document. La structure générique logique permet plusieurs chose :

D'une part, elle permet de définir quels sont les noms des structures logiques permises. Ainsi, un document bureautique normal sera défini comme pouvant être composé de chapitres, titres, de paragraphes, de zones d'adresse, de zones de signature, de zones de référence etc... Il ne pourra par exemple pas contenir une structure qui s'appelle 'brol' si cette structure n’a pas été définie dans la structure générique logique.

D'autre part, elle permet de définir des valeurs standards pour certains attributs liés à une structure. Elle permettra de définir par exemple qu'un titre est toujours en gras ou bénéficie d'une numérotation automatique. Ces valeurs standards permettent d'assurer une mise en page uniforme du document, c-à-d qu'un lecteur puisse facilement, à partir de la description physique du document, reconstituer mentalement sa description logique.

Enfin, la structure générique permet de définir l'ordre d'enchaînement permis des structures logiques. Cet ordre d'enchaînement peut être partiel ou complet. Il définira par exemple qu'un document de type 'lettre' doit être formé d'une zone d'adresse pour l'expéditeur, d'une zone d'adresse pour le destinataire, d'une zone date, d'une suite de paragraphe et finalement d'une zone de signature. Un document lettre pourra aussi comprendre de façon optionnelle une zone de référence interne et une zone de référence aux annexes.

53

La norme définit une série d'attributs standards que l’on peut associer aux structures logiques, que celles-ci appartiennent à la structure générique ou non. Ces attributs permettent de diriger la mise en page, c-à-d le passage de la description 'logique' à la description 'physique'. Un des ces attributs permet par exemple de signaler que la structure logique doit être mise en page dans la même page que la structure logique qui la précède (et donc éventuellement que le saut de page doit être anticipé au niveau de la structure logique précédente). Un autre attribut permet de spécifier qu'un bloc doit être mis en page dans l'ordre naturel mais en commençant à partir du bas de la page et non à partir du haut. La combinaison de ces 2 attributs (et d'une numérotation adéquate) permet de représenter les notes en bas de page.

1.15.4. Les blocs, entre la description logique et la description physique

Les blocs représentent des morceaux élémentaires de textes, des tableaux, de dessins ou des photos. Ils sont partagés entre la structure physique et la structure logique lorsqu'une description d'un texte comprend les deux structures. En fait, ils peuvent être plutôt logiques (par exemple sans les retour-marges de fin de ligne), plutôt physiques (par exemple avec des retour-marges de fin de lignes indiqués en dur) ou mixtes (par exemple avec une indication spéciale pour les retour-marges de fin de ligne identifiant ceux qui ont été générer par le système de mise en page). Un tel mélange ne clarifie bien entendu pas l'utilisation de la norme.

Le caractère commun des blocs pour les deux descriptions s'accorde mal avec la résolution du problème concret de la mise en page. Celle-ci peut amener à couper un bloc en deux et la description logique comprend alors deux blocs (comprenant des valeurs d'attributs qui indiquent leur 'attachement commun') alors qu'en fait un seul est strictement nécessaire.

1.15.5. La structure physique du document

La structure physique, elle, ne peut contenir qu’un certain nombre de structures identifiées explicitement par la norme. Ainsi cette représentation du document est définie comme comportant un ensemble de pages, chaque page comprenant une ou plusieurs 'frames' délimitant les endroits où le texte peut être placé. Ces frames permettent de créer des textes multi-colonnes en créant éventuellement des synchronisations entre les colonnes parallèles (pour, par exemple, mettre en regard un texte avec sa traduction). La description générale de la structuration d'un ensemble de pages qui doivent toutes avoir la même structure de 'frame' est prise en charge par une structure générique physique qui décrit tout ce qui est commun à l'ensemble des pages. C'est dans cette structure que l'on décrira la mise en page (layout) standard des pages (si elle existe).

54

On remarquera que la structure physique peut donner lieu à des interactions étranges avec la structure logique. Ainsi, les têtes (header) et les pieds (footer) de page font partie de la structure physique (et plus particulièrement de la structure physique générique). Pourtant, si l'on souhaite que leur contenu soit révisable, il faut qu'il fasse partie de la structure (générique) logique. Donc, alors que dans la plupart des cas, c'est l'organisation et les attributs de la structure logique qui déterminent la mise en page, dans ce cas précis, c'est l'inverse qui se produit ; la nécessité d'effectuer une mise en page impose la création d'une (ou de plusieurs) structures physiques pour représenter les têtes et les pieds de page... et celles-ci vont rechercher leur contenu dans la structure logique physique.

1.15.6. Les difficultés liées à l’universalité de la norme

La norme ayant été définie par une organisation internationale, elle doit permettre la représentation de n'importe quelle écriture s'appliquant à n'importe quelle langue. En particulier, elle doit permettre la représentation de documents écrits dans des langues qui imposent l'écriture des pages en ordre inverse de l'ordre 'latin' et écrits de droite à gauche (Arabe, Hébreux), même si certaines de ces langues ont des particularités (ainsi, en Arabe, le texte s'écrit de droite à gauche mais les dates, par exemple s'écrivent de gauche à droite).

Elle doit aussi permettre la représentation de langues qui imposent (ou permettent) l'écriture de haut en bas comme le japonais. Pour cette raison, la norme définit des concepts très abstraits de mise en page. Ainsi, chaque document a une orientation préférentielle de la mise en page des blocs (horizontale ou verticale) et au sein de cette orientation donne une direction privilégiée de mise en page des blocs. Au sein de chaque bloc, il est aussi possible de définir une orientation privilégiée des caractères (la plupart des langues considèrent que les caractères sont posés horizontalement même si la progression des lignes est verticale) et un sens de la progression des caractères.

Cette généralité de la norme rend difficile son application. Aussi, certaines organisations de standardisation régionale ont-elles tenté de créer des 'profils' restreignant l'usage de la norme.

Ces profils ont tenté de placer des restrictions sur les valeurs possibles de certains paramètres. Ainsi, pour l'Europe de l'ouest, les profils ne permettront que la production de texte écrits dans une langue permettant l'écriture de gauche à droite avec un ordre des pages qui prévoit que la reliure est à gauche de la première page (c-à-d que pour le 'recto', la reliure est du coté où démarre la ligne avec une langue écrite de gauche à droite).

Ces profils ont tenté de définir des restrictions quant aux structures qui pouvaient être utilisées. Ainsi, certains profils ne permettent que des documents d'une seule colonne ; d'autres ne permettent ni dessins, ni photos.

55

Ces profils ont surtout tenté de définir une architecture pour la structure logique du document, en définissant le nom des différentes structures logiques possibles et la grammaire à laquelle elles appartiennent (c-à-d les enchaînements possibles).

1.15.7. Les raisons de l’échec

La norme en général et les profils en particulier ont été un échec et la cause fondamentale n'est pas difficile à trouver : il n'y a pas 'une' structure logique pour un document. Si une standardisation propose une structure très générale pour la structure logique (quelque chose comme un 'paragraphe généralisé'), elle ne pourra pas garder le niveau de richesse supporté par certaines structures dans certains traitements de texte. Si au contraire, elle devient trop spécialisée, elle ne sera pas capable de représenter certains documents.

Une solution semble être de suivre de près la structure utilisée par les traitements de texte existant sur le marché à un moment donné et associer la structure logique aux 'styles' présents dans les traitements de texte. Mais bien entendu, cette solution conduit à une synchronisation entre la norme et l'évolution des traitements de texte... Jusqu'il y a quelques année, cette synchronisation semblait difficile, vu l'évolution des traitements de texte. La stabilisation de ceux-ci au cours de ces dernières années, ainsi que la réduction de leur nombre sur le marché aurait pu rendre faisable la stabilisation de la définition des structures logiques dans les profils... mais cette stabilisation réduit aussi considérablement l'intérêt de la norme.

1.15.8. ODA et les classes

Un problème qu'a eu la norme également (au moins dans ses premières versions) a été de ne pas suffisamment prendre en compte la structuration en classe, particulièrement dans la structuration logique. La notion de structure générique logique a, au cours du temps, été rebaptisée 'classe' de façon à donner une orientation objet à la norme. Néanmoins, celle-ci ne fait pas assez la différence entre la notion de classe (un paragraphe est un morceau de texte qui peut être indenté) et la notion de composition (un paragraphe est formé d'une suite de phrases).

L'utilisation générale d'une structuration en classe des structures logiques, en parallèle avec une hiérarchie de composition permettrait de mieux gérer les attributs qui sont applicables aux différents niveaux de la structuration logique.

1.15.9. La réduction du nombre de traitements de texte

C'est cependant probablement la réduction du nombre de logiciels de traitements qui a le plus nuit au développement de la norme. Le marché s'est en effet réduit à quelques intervenants pour des raisons qui ont déjà été mentionnées dans l'historique. Or l’utilité d’une norme ‘pivot’ n’est évidente que s’il y a un grand nombre de conversions possibles entre un grand nombre de format de traitements de texte différents.

56

De plus, chaque producteur de traitement de texte a fait un effort pour fournir des outils pour effectuer des conversions à partir des formats supportés par ses concurrents. Cela lui permettait d’espérer accroître sa part de marché. Ces conversions sont loin de fonctionner correctement pour des raisons déjà évoquées mais l'adoption d'une norme pour effectuer la conversion, qui rajoute une étape supplémentaire de conversion, ne facilite certainement pas la solution de ces problèmes.

Il faut aussi noter que l’implémentation de la norme dans des produits de traitement de texte n’est pas facile parce que le passage d'une description 'logique' des textes à une description 'physique', tel qu’il est décrit dans la norme, est un processus difficile par exemple pour du texte ou des tableaux.

Ainsi, dans le cas de texte, il faut faire intervenir des techniques relativement sophistiquées pour utiliser des polices de caractères non proportionnelles, des césures de mots correspondant à la pratique courante dans la langue du texte, la notion de coupure de page, d'indentation, de justification... Une norme qui se voulait universelle se devait d'incorporer toutes ces particularités dont l'origine est souvent des coutumes propres à certaines langues.

La mise en page de tableaux pose aussi des problèmes complexes principalement parce que l'usage des machines à écrire les a fait considérer longtemps comme des structures dissymétriques organisées en lignes et tabulations et qu'il a fallu quelques années pour que la structure matricielle (qui s'adapte mieux à une évolution du contenu d'un tableau) s'impose pour sa représentation logique.

D’autres problèmes sont difficiles à gérer dans une implémentation, comme la relation entre texte et dessin. Le texte peut par exemple ‘couler’ autour du dessin ou, au contraire, le dessin peut être fixé au texte.

Tous ces problèmes sont abordés et résolus dans les traitements de texte, au moins dans leurs versions les plus récentes. Mais ces traitements de texte peuvent choisir la représentation la plus adéquate pour faciliter leur implémentation. Construire un traitement de texte autour d’une représentation imposée, ou même simplement implémenter un ‘afficheur’ (viewer) pour une représentation dont le but est de faciliter l’échange entre traitements de texte est nettement plus difficile.

1.16. SGML, XML et XSL

1.16.1. La standardisation des représentations riches

Standardiser des représentations pauvres est relativement facile comme décrit précédemment. Il n’y a qu’un petit nombre d’éléments de base et, avec ces représentations, on peut représenter un grand nombre de documents.

Dès que l’on veut représenter des représentations riches, les éléments de base sont beaucoup plus spécifiques et le type de documents représentables au moyen de ces éléments de base devient de plus en plus limité.

57

Par conséquent, l’effort de standardisation des représentations s’est porté, non sur la représentation des documents, mais sur la définition de règles permettant de représenter des documents de richesse différente.

La plupart des systèmes de représentation se sont basés sur les langages de marquage, dont un exemple est HTML. Ces langages de marquage sont dérivés des anciens langages de commande des formateurs ‘Batch’. Mais, alors que les commandes d’un langage de formatage étaient des instructions de mise en page c-à-d des éléments de structuration procéduraux, les balises d’un langage de marquage sont des éléments de structuration déclaratifs, visant juste à décrire explicitement la structure d’un texte.

Un langage de marquage peut représenter effectivement des documents à des niveaux de représentation de richesse différente. Ainsi une lettre commerciale peut être décrite par la représentation dans un langage de marquage à un niveau très riche, comme dans l’exemple suivant :

<LETTRE>

<EXPEDITEUR>M. Bertrand</EXPEDITEUR>

<DESTINATAIRE>ULB</DESTINATAIRE>

<DATE>11/11/1995</DATE><ENTETE>Monsieur</ENTETE>

<CORPS><PARAGRAPHE>Veuillez trouver ci-joint un exemplaire du cours de bureautique 1995-1996</PARAGRAPHE></CORPS>

<SIGNATURE>Ph.Bertrand</SIGNATURE> </LETTRE>

(à noter que les sauts de lignes n'ont aucune interprétation)

La représentation est très structurée, donc très riche et elle ne s'applique qu'à un certain type de document. Une telle description, jointe à la définition de règles de mise en page générale des structures 'expediteur', 'destinataire', 'date', 'entête', 'corps_de_lettre' et 'signature' permet d'assurer une représentation très précise d'une lettre. Une organisation qui adopterait une telle description de ses lettres commerciales aurait un courrier qui aurait un 'look' uniforme d'entreprise.

La même lettre peut cependant aussi être décrite de la façon suivante par un langage de marquage :

<ligne>M. Bertrand</ligne> <ligne></ligne>

<ligne><blanc nbre=50>ULB</ligne>

<ligne></ligne> <ligne></ligne>

<ligne><blanc nbre=45>11/11/1995</ligne>

<ligne></ligne> <ligne>Monsieur</ligne> <ligne></ligne>

58

<ligne>Veuillez trouver ci-joint un exemplaire du cours de bureautique 1995-1996</ligne>

<ligne></ligne> <ligne><blanc nbre=50>Ph. Bertrand</ligne>

(où <blanc nbre=50> veut dire 'apparition de 50 blancs')

Une telle description est beaucoup plus pauvre... mais s'appliquera à une plus grande variété de documents.

Il est donc possible de créer des représentations balisées à des niveaux de richesse différents.

L’exemple ci-dessous illustre un autre point important. Dans le cas de la représentation pauvre, la structuration étant proche de la représentation physique, la signification en terme de mise en page du texte est très facile à comprendre et l’implémentation d’un programme capable d’interpréter chaque balise et de générer la mise en page du texte est facile. Le nombre de balise est peu nombreux et leur relation avec la mise en page est statique. Une balise <ligne> sera toujours traduite par un saut de ligne et une balise <blanc> par l’écriture d’un certain nombre de blanc. Le programme de traduction peut donc être écrit définitivement.

Par contre, dans le cas d’une représentation riche, le programme chargé de générer la mise en page de chaque balise sera complexe et spécifique. Il faudra écrire un nombre important de tels programmes à cause du nombre important de balises (qui représentent chacune un ‘élément de base’), résultat de leur spécificité. De plus, le lien entre balise et mise en page est assez volatil. Un jour, on souhaitera écrire signature 2 lignes en dessous de la fin du texte, en la plaçant à droite alors qu’à un autre moment, on souhaitera qu’elle soit placée plutôt à gauche, 5 lignes en dessous du texte. Il est donc important que le programme qui fait la mise en page (c-à-d qui convertit la représentation ‘riche’ de la balise en une représentation plus pauvre, type ‘pixel’ par exemple) puisse être modifié facilement.

Pour cette raison, on a assister à l’apparition de langages spécialisés pour effectuer cette mise en page. Ces langages sont des langages de style. Ils expriment de façon formalisée la façon de mettre en page un ensemble de balises d’une description riche.

La norme ODA avait aussi rencontré le même problème de volatilité de la liaison entre une représentation structurée riche (la représentation logique) et une représentation physique plus pauvre (la représentation physique). Son approche avait été d’associer à chaque structure logique un ensemble d’attributs capables de spécifier, en association avec des règles de grammaires énoncées dans des structures génériques, comment un programme général pouvait, au départ de ces informations, effectuer la mise en page, c-à-d la création d’une structure physique. Le choix judicieux des attributs permettait de varier la mise en page. Cette approche était très ambitieuse et très complexe.

59

L’approche par langage de style est plus pragmatique, puisque le style est un programme spécifique de mise en page, dont la caractéristique est simplement d’être bien adapté à la tâche de mise en page et d’être facilement exécutable par un interpréteur simple.

1.16.2. Le SGML

Le SGML (Standard Generalized Markup Language) est une norme ISO qui existe depuis le milieu des années 80. Comme tous les langages de marquage, la syntaxe SGML s'écrit dans des fichiers linéaires écrit en ASCII. Un fichier écrit en SGML est donc 'lisible' par un simple éditeur de texte et ce caractère 'non secret' du contenu d'un fichier SGML a largement contribué au succès de la norme à une époque où les représentations informatiques ‘sérieuses’ utilisaient des représentations binaires (c-à-d non lisible humainement) tel que ASN.1 (A Simple Notation).

SGML n’est pas comme HTML une standardisation de la représentation de documents. SGML, en particulier, ne définit pas de marqueurs (de balises). SGML est un méta-langage, c-à-d qu’il définit comment représenter des balises ou les attributs dans une balise. Il définit par exemple aussi le jeu de caractères qui peut être utilisé et un grand nombre de règles de syntaxe. C’est donc une définition d’un langage permettant ensuite de définir des représentations à des niveaux de richesse arbitraire.

La force du SGML provient de la notion de DTD. Une DTD (Document Type Definition) est la description de la règle d’emboîtement des structures décrites par les balises. C’est en quelque sorte la grammaire que doit suivre le document pour être valide. Une DTD doit toujours être associée à un document SGML. Grâce à la DTD qui l’accompagne, il est toujours possible de déterminer si un document marqué selon cette DTD est valide ou non. Le document est valide s’il respecte la grammaire définie par sa DTD. Ce travail d'analyse peut être effectué par un 'parser SGML' qui est une sorte de compilateur générique qui interprète la DTD comme le langage de programmation à compiler et le document comme un programme écrit dans ce langage de programmation. Beaucoup de 'parsers SGML' sont aussi capables de produire une sortie c-à-d de transformer la représentation du document écrit selon la DTD (le document riche) dans une autre représentation, en général plus pauvre.

La syntaxe d’une DTD est assez rébarbative.

Un exemple est le suivant :

< !DOCTYPE LETTRE [

< !ELEMENT LETTRE (EXPEDITEUR, DESTINATAIRE, DATE, ENTETE, REFERENCE ?, CORPS, SIGNATURE)>

< !ELEMENT EXPEDITEUR (#PCDATA)>

< !ELEMENT DESTINATAIRE (#PCDATA)>

….

60

< !ELEMENT CORPS (PARAGRAPH+)>

< !ELEMENT PARAGRAPH (#PCDATA)>

< !ELEMENT SIGNATURE (#PCDATA)>

]>

Dans cet exemple, on définit un document de type lettre comme contenant un expéditeur, un destinataire, une date, une entête, une référence optionnelle (à cause du signe ‘ ?’), un corps (de lettre) et une signature. Tous ces éléments, sauf le corps de lettres sont des éléments ‘de base’ (#PCDATA). Le corps de lettre comprend un ou plusieurs paragraphes (à cause du ‘+’), et ces paragraphes sont des éléments ‘de base’. La lettre commerciale mentionnée ci-dessus est valide pour cette DTD.

Le SGML est très souple, très riche et très complexe. La spécification complète de la norme fait plusieurs centaines de pages. Ainsi certaines structures peuvent avoir des balises de début mais omettre les balises de fin dans certains cas (si la structure est par exemple la dernière structure d'une structure de plus haut niveau). Les balises peuvent avoir des synonymes qui n'ont pas la forme '<'...'>'. Si bien que finalement n'importe quel document qui a une structure marquée de n'importe quelle façon et qui dérive d'une grammaire non ambiguë et formelle peut être analysé par un parser SGML... pour autant qu'on lui fournisse la DTD adéquate.

Le SGML a eu de nombreuses applications. Les ateliers de photocomposition l’ont utilisé pour structurer les documents afin d’en construire la composition. Chaque balise correspondra à des structures qui ont des représentations différentes dans le processus de composition.

De même dans le traitement préalable d’un document avant son introduction dans une base documentaire, il est fréquent de le marquer au moyen de balises SGML de façon à identifier l'auteur, le résumé et le corps du texte qui seront associés à des champs différents de la base documentaire.

Des organismes imposent parfois leur DTD SGML pour permettre la communication avec leurs partenaires. Ainsi, le département de la défense impose que tous ses documents soient marqués dans une syntaxe SGML appelée 'CALS'. L'association des auteurs Français a aussi défini une DTD définissant comment un roman à éditer doit être marqué pour faciliter le travail d'édition. Et d'autres éditeurs tel l'Office des Publications des Communautés européennes communiquent avec leurs imprimeurs via un standard dérivé du SGML. La librairie du Congrès Américain, des dictionnaires tels l’ « Oxford English Dictionary » ou des encyclopédies tels « Encarta » de Microsoft utilisent le SGML.

61

Dans toutes ces applications, la force du SGML provient de sa notion de DTD. Grâce à celle-ci, il est possible de déterminer si un document est prêt à être photocomposé, ou à être introduit dans une base documentaire. La DTD permet de savoir aussi si un document contient bien toute l’information qu’il doit absolument contenir. Le SGML est donc fortement utilis é dans tous les documents obéissant à un formalisme strict tels des documentations techniques ou des documents s’appliquant à un domaine juridique. Permettant une structuration à n’importe quel niveau de richesse tout en garantissant le respect de la structuration, il est souvent utilisé comme la représentation ‘mère’ dont sont dérivées toutes les autres (publication papier, publication CD-ROM, publication WEB).

Il existe aussi des éditeurs SGML qui permettent de définir une DTD puis facilite le processus de création de document respectant cette DTD en guidant l’utilisateur de façon à ce que celui-ci ne puisse produire que des documents conformes.

Ayant été développé à peu près à la même époque, on a souvent comparer ODA à SGML. Les deux normes ont été développées par des équipes différentes et ont peu de références entre elles alors qu'elles semblent traiter le même sujet. En particulier, elles permettent toutes les deux de définir une série de structures, de définir la grammaire de leur emboîtement et de représenter ou de décrire des documents. Pourtant les deux normes sont très différentes :

ODA est principalement un standard pour décrire un document type ‘traitement de texte’ et surtout décrire le lien entre une structure logique et une structure physique. Sa valeur ajoutée principale est de définir l'ensemble des attributs qui sont nécessaires pour passer de la structure logique et la structure physique. Il décrit aussi assez bien la différence entre la structure générale du document et l'apparition de 'bloc' à partir d'un certain niveau.

SGML est principalement un standard de représentation de structure hiérarchique permettant le contrôle de la conformité de la hiérarchie à une grammaire. En un certain sens, SGML pourrait être utilisé pour représenter n'importe quelle organisation hiérarchique (comme par exemple une hiérarchie de tâches ou d'activités) et son utilisation pour représenter des documents n'est qu'une de ses applications possibles.

Pour illustrer la relation entre les deux normes, on peut noter qu'un document ODA peut être codé dans la syntaxe binaire ASN.1 mentionnée plus haut. Mais il peut aussi être codé en SGML et il existe une version de la norme ODA décrivant la représentation d'un document ODA en SGML

62

1.16.3. XML et XSL

XML (eXtended Markup Language) est une simplification de SGML. Alors que SGML est destiné à reconnaître des marquages, même sous des déguisements divers, XML est plus simple parce qu’il est destiné exclusivement à représenter des documents destinés à être affichés dans un afficheur (browser) WEB. XML est en fait une restriction de SGML et à quelques subtilités près, un document XML est aussi un document SGML. En particulier, la spécification de XML reprend la notion (et la syntaxe) des DTD SGML.

L’origine de XML n’est cependant pas une évolution directe de SGML, mais bien le résultat des problèmes rencontrés avec le HTML. La définition est donc très récente et pas tout à fait stable.

Le problème de HTML est lié à la richesse de représentation qu’il permet. Initialement très simple et donc très pauvre, il s’est progressivement enrichit de nouvelles balises au fur et à mesure de ses versions successives. Chaque nouvelle version de HTML demande une nouvelle version de l’afficheur (browser), ce qui impose des mises à jour fréquentes pour les utilisateurs. De plus, l’utilité des extensions est devenue de moins en moins évidente et les balises reconnues par les afficheurs des deux constructeurs qui se disputent le marché sont différentes pour les fonctions les plus pointues.

Le caractère pauvre du HTML oblige aussi les auteurs de documents à maintenir de multiples versions de ceux-ci, surtout s’ils sont fort structurés. Un problème connexe est que selon que le destinataire est un homme ou une machine, il faudra utiliser dans un échange de document un format de type HTML ou un format de type EDI (Electronic Data Interchange), illisible par l’homme.

L’idée des promoteurs de XML est de substituer progressivement HTML par XML. Chaque document envoyé à un afficheur serait donc un document balisé selon des balises définies par l’auteur selon le type de document. L’afficheur serait alors capable de l’afficher en interprétant les balises.

Bien entendu, l’interprétation des balises deviendra alors spécifique à chaque document. Une façon de la faire serait de télécharger dans l’afficheur un programme spécifique à chaque document capable de l’afficher selon la définition de ses balises. Ce programme peut être écrit en JAVA, un langage général téléchargeable et exécutable dans un afficheur. Cette solution parait cependant lourde et revient preque à reconstruire un afficheur par type de document (par type de DTD).

Une solution plus souple consiste à télécharger avec le document XML, une feuille de style XSL. XSL (eXtended Stylesheet Language) est un language de style. C’est un langage qui permet, à partir d’un document marqué en XML de produire un document … HTML, prêt à être affiché. XSL pourrait aussi produire d’autres formats affichables, comme du Postscript…

63

Une feuille de style XSL est donc un programme écrit dans un langage de programmation déclaratif. Cela signifie que le programme est écrit sous la forme de règles indépendantes (comme dans les systèmes expert, si populaires fin des années 1980) et que lors de l’exécution, un interpréteur choisit selon les données présentées les règles à exécuter avant de faire l’exécution proprement dite. Ce type de programmation a l’avantage de créer des programmes extensibles. Etendre les fonctionnalités du programme consiste juste à créer de nouvelles règles.

En pratique, un programme XSL est donc un ensemble de règles. Chaque règle définit une clause d’activation qui reprend généralement le nom d’une balise et éventuellement une condition sur un attribut de cette balise. La règle sera donc activée lorsqu’elle rencontrera dans le document une balise correspondant à la clause d’activation. La règle d’activation peut aussi spécifier une hiérarchie de balise et donc ne s’appliquer que pour une balise donnée, à condition que celle-ci apparaisse dans le texte dans la même hiérarchie que celle spécifiée dans la clause d’activation.

Chaque règle comprend aussi une clause d’action. Celle-ci s’énonce simplement en donnant les balises HTML à générer. De plus, une balise spéciale <children/> donne l’ordre de traiter l’intérieur de la balise qui a déclenché la règle d’action. Il existe aussi des possibilités plus complexes, notamment de sélectionner l’action en fonction du contexte dans lequel apparaissent les balises comprises dans la balise sur laquelle s’applique la règle.

Il est à noter qu’une même règle peut s’appliquer à une balise et puis ensuite aux balises comprises à l’intérieur de cette balise. Cette activation récursive contribue fortement à la puissance du système de règles. Plusieurs règles peuvent aussi être activables en même temps. Dans ce cas, un système de priorité sélectionne la règle la plus spécifique comme étant celle à exécuter.

La syntaxe de XSL est… XML. Un exemple de règles XSL aura par exemple la forme suivante :

<xsl>

<rule>

<target-element type= "EXPEDITEUR"/>

<title>Expéditeur:</title>

<children/>

</rule>

<rule>

<target-element type = "CORPS"/>

<HR>

<children/>64

</rule>

<rule>

<target-element type = "PARAGRAPH"/>

<P font-style="italic">

<children/>

</P>

</rule>

</xsl>

La première règle est valable pour la zone marquée par la balise "EXPEDITEUR". Elle demande d'écrire le titre "Expéditeur:" suivi de la mise en page de la balise.

La deuxième règle est valable pour la zone marquée par la balise "CORPS". Elle demande de tracer une ligne horizontale, puis de travailler sur les fils, c-à-d l'intérieur du corps du texte (les paragraphes).

Enfin la troisième règle balise chaque paragraphe par une balise de paragraphe ; le contenu du paragraphe devant être en italique….

Pour illustrer la récursivité du mécanisme de règle, on peut noter que la règle

<xsl>

<rule>

<target-element/>

<DIV>

<children/>

</DIV>

</rule>

</xsl>

est une règle qui s'applique à chaque structure et que pour un texte similaire à

<CORPS><PARAGRAPH>Voici un paragraphe</PARAGRAPH>

<PARAGRAPH>… et en voici un autre.</PARAGRAPH>

</CORPS>

65

elle produira

<DIV>

<DIV>Voici un paragraphe</DIV>

<DIV>… et en voici un autre.</DIV>

</DIV>

… c-à-d un texte divisé en division selon la hiérarchie de la structure.

1.17. Les classiques: le traitement de texte et les outils de dessin

Des outils comme les traitements de textes, les logiciels de dessins et les logiciels de retouche de photos sont trop connus que pour être décrits en détail ; ce chapitre va juste rappeler leurs principes généraux communs ainsi que certaines de leurs particularités.

Chacun de ces outils manipule des documents dont la description s'appuie sur un ensemble d'éléments de base. Un traitement de texte utilise la notion de paragraphe, de bloc, de segment et de caractère. Un logiciel de dessin utilisera lui la notion de courbe (droite, ellipse, courbe de Bézier) et un logiciel de retouche de photo sera basé sur la notion de point imprimable (pixel).

Un logiciel de création de document comprend 2 parties bien distinctes :

Une partie d'entrée qui permet au départ d'une interface programmatique, elle même commandée par l'interface utilisateur d'introduire de nouveaux éléments, de détruire des éléments existants ou de modifier les paramètres des éléments existants (attributs et liens avec d'autres paramètres).

Une partie d'affichage qui permet d'afficher les différents éléments de base en les traduisant dans les éléments supportés par le système d'affichage (écran ou imprimante).

Le logiciel, lorsqu'on le lance et qu'un fichier existant est sélectionné, affiche sur l'écran les différents éléments. Pour ce faire, il prend les éléments un à un et les représente sur l'écran en créant les éléments de base nécessaires dans le système de fenêtrage (il s'agit donc de la conversion de la représentation en une représentation plus pauvre, affichable sur l'écran). Lorsqu'un utilisateur sélectionne un élément sur son écran, l'élément correspondant est sélectionné dans le système de fenêtrage et un événement est généré. Cet événement permet alors d'identifier un élément dans la structure représentant le document. Lorsque l'utilisateur effectue une action (ajouter un caractère, créer un nouveau paragraphe...), cette action est appliquée sur la structure courante sélectionnée dans la représentation du document via l'interface programmatique. Après que l'action aie été appliquée sur la structure représentant le document, celle-ci est à nouveau affichée. On a donc une boucle d'interaction comprenant

L'affichage de la structure courante66

Chapitre 4: Quelques types de documents et leurs outils

L'entrée des commandes de l'utilisateur

La modification de la structure représentant le document

Le réaffichage du document modifié.

Pour que le logiciel soit utilisable, il faut que cette boucle puisse s'exécuter suffisamment vite. Cela signifie en particulier que le processus d'affichage doit être assez rapide. Dans le passé, cette condition ne pouvait être remplie que de 2 façons :

En choisissant une structure de description de texte suffisamment simple de façon à ce que le processus d'affichage ne consomme pas trop de temps. C'est pour cette raison que les premiers traitements de texte travaillaient sur une structure de texte assez simple.

Ou bien en effectuant un affichage moins précis. Le traitement de texte cesse alors d'être WYSIWYG (What You See Is What You Get) puisque ce qui est affiché sur l'écran n'est plus qu'une version approximative de ce qui sera imprimé sur l'imprimante. Dans le passé, cette solution était largement utilisée parce que les capacités de visualisation des écrans, basés sur des caractères dont la police ne pouvait pas être changée étaient de toute façon largement inférieures à la capacité d'affichage des imprimantes. L'arrivée des systèmes de fenêtrage a changé ce fait et un traitement de texte actuel doit être rigoureusement WYSIWYG.

Bien entendu, chaque logiciel utilisera aussi des 'trucs' pour accélérer la boucle. Ainsi un traitement de texte peut se contenter d'afficher physiquement les caractères entrés par un utilisateur (en se contentant de repousser ceux qui suivent sur la ligne) tant que l'entrée de nouveaux caractères ne provoque pas une réorganisation de tous les paragraphes qui suivent.

La plupart de ces logiciels sont associés à un langage de macro. Ces macros permettent d'enregistrer une séquence d'actions, de les modifier, d'y associer un nom et de les exécuter. Au fur et à mesure qu'ils se sont enrichis, ces langages de macro sont devenus de véritables langages de programmation souvent similaire à une variante de Visual Basic. Au départ, chaque logiciel d'édition était fourni avec son propre langage de macro. Avec le temps, les éditeurs de logiciel se sont orientés vers le concept de suite avec une unification des langages de macro ainsi que de l'interface utilisateur.

Ces langages de macro s'appuient tous sur l'identification d'une série d'objets dans le document. Ainsi, on pourra avoir des objets de type Words, de type Characters, de type Sentences, de type Paragraphs, de type Sections, pour un traitement de texte qui définit des objets de ce type. Grâce à cette structure, on peut identifier des morceaux de type via par exemple un index. Ainsi, Paragraphs(1) représentera le premier paragraphe du document, Paragraphs(5) représentera le 5ème paragraphe. Des types de propriétés de ces objets s'exprimeront par d'autres objets. Ainsi la bordure d'un paragraphe pourra être modifiée via l'objet Borders.

L'instruction

With ActiveDocument.Paragraphs(1).Borders(wdBorderBottom)

67

.LineStyle = wdLineStyleDouble

.LineWidth = wdLineWidth025pt

End With

Aura donc pour effet de créer un cadre d'1/4 de pouce en double ligne autour du paragraphe.

Ces langages sont donc très puissants et permettent de créer des véritables applications de construction de documents. Leur puissance les rend cependant aussi un vecteur possible de transmission de virus informatique…

Ils permettent aussi de mieux comprendre la façon dont fonctionne un logiciel comme un traitement de texte. Lors de l'affichage d'une portion de texte, la partie "afficheur" du traitement de texte demande l'affichage de l'objet le plus général. Celui-ci va à son tour demander l'affichage de structure de plus en plus petites, paragraphes, phrases, mots caractères. De la même façon, lorsqu'un utilisateur demande une action, l'événement peut être généré au niveau le plus élémentaire, puis, si nécessaire s'appliquer à des structures de plus en plus globale.

Chaque logiciel a ses propres particularités. Ainsi un traitement de texte sera souvent associé à des structures spécialisées tels que des outils d'édition d'équation mathématique. Il comprendra aussi un correcteur orthographique, qui est une simple liste de tous les mots (avec leurs flexions) qui existent dans une langue donnée. Lorsqu'un utilisateur utilise cet outil, il peut enrichir de façon temporaire ou définitive le dictionnaire au fur et à mesure de la rencontre de mots spécialisés propres à un domaine qui ne sont d'habitude pas dans le dictionnaire.

Plus récent et plus complexe à créer sont les correcteurs grammaticaux. De tels logiciels doivent analyser la structure de chaque phrase de façon à identifier des problèmes d'accord ou d'autres fautes grammaticales. Ce processus est complexe parce que les règles grammaticales d'une langue sont complexes et peu régulières. De plus, jusqu'à un certain point, la grammaire d'une phrase dépend de sa signification.

Un outil qui dépend encore plus de la signification des mots est le traducteur de texte. La traduction automatique de texte est encore assez imparfaite parce qu'une bonne traduction dépend fortement de la compréhension du texte c-à-d d'une analyse sémantique hors de portée des techniques actuelles. Néanmoins, la pression pour disposer de tels outils est telle que même des outils imparfaits ont leur utilité.

Un produit proche du traitement de texte est l'afficheur (viewer) de document. De plus en plus, les éditeurs de traitement de texte fournissent avec leur logiciel des afficheurs qui peuvent être diffusés gratuitement ou être couplés avec le document. Un afficheur, surtout s'il est inclus dans un document, permet d'envoyer un document sans que le destinataire ne dispose nécessairement du logiciel nécessaire pour l'affichage.

68

Un bon afficheur doit être compact de façon à pouvoir être envoyé avec le document, il doit permettre de parcourir un maximum d'information en un minimum de temps sans dégrader la mise en page. En fait c'est une erreur importante de croire qu'un afficheur n'est qu'une variante simplifiée du traitement de texte. Un traitement de texte doit être réservé aux personnes qui encodent ou modifient du texte. Son objectif doit être de faciliter les fonctions qui leur sont nécessaires. Un afficheur doit être beaucoup plus simple et surtout il doit faciliter le parcours rapide. Il devra si possible offrir des fonctions de recherche par mot clef (index), permettre d'afficher plusieurs pages simultanément et offrir des fonctions qui permettent de simuler la 3ème dimension, celle qui permet de feuilleter un document.

Les logiciels de dessins utilisent usuellement la notion de vecteurs, c-à-d de description mathématique de courbe. Ils sont basés sur un ensemble de courbes standards (droites, ellipses, rectangles, courbes de Bézier) que l'utilisateur crée au moyen du logiciel et dont il peut modifier les paramètres ultérieurement. Le facteur structurant principal dans un dessin est la notion de groupe. Il est possible de prendre un ensemble de courbes élémentaires ou de groupes déjà existants et de construire de nouveaux groupes. Chaque groupe peut représenter un objet (une tête, une main...) et être manipulé en bloc (étirage, rotation, translation). Les groupes permettent une bonne utilisation des 'cliparts' c-à-d de librairies de dessins. Les dessins sont en effet organisés par groupe et il est possible d'extraire une partie d'un dessin pour l'exploiter dans un autre dessin. A noter que les logiciels de dessins utilisés en bureautique permettent l'édition en 2 dimensions. Les logiciels de conception assistée par ordinateur permettent l'édition en 3 dimensions mais sortent du cadre de la bureautique classique.

A côté des logiciels de dessin vectoriel, il existe aussi des logiciels opérant sur les pixels. Le logiciel de dessin 'pixel' (ou bitmap) tel que Paintbrush sont des logiciels très élémentaires et peu puissants. Les logiciels de retouche photo sont eux aussi des logiciels basés sur le traitement des pixels. Ils permettent d'analyser une masse de pixels, d'en déduire certains paramètres statistiques globaux et d'effectuer des modifications d'ensemble. Ces analyses peuvent être basées sur de simples histogrammes de niveaux de gris ou de balance des couleurs. Ils peuvent impliquer des techniques plus complexes tels des transformations de Fourier pour modifier des composantes de l'image dans certaines gammes de fréquence et provoquer par exemple un adoucissement ou un durcissement des contrastes.

1.18. Le tableur

Le tableur a été le premier logiciel utilisable par les cadres. Il leur permet de construire rapidement un système de simulation permettant de connaître rapidement les effets de la variation de certains paramètres sur un modèle. Il est particulièrement utile pour effectuer des simulations simples dans les domaines économiques ou financiers. C'est donc lui qui a 'anobli' le PC qui, jusqu'à son arrivée, était réservé au personnel de secrétariat et aux fanatiques de la programmation. A cause de l'apparition du tableur, des personnes qui n'avaient jamais été intéressées que par les résultats de l'informatique et non par ses moyens (des financiers, des économistes, des gestionnaires, tous non informaticiens) ont commencé à exprimer un avis sur l'architecture informatique de l'entreprise et à exiger entre autre chose que celle-ci supporte les PCs et les tableurs qui leur étaient si utiles.

69

Un tableur est un système matriciel à 2 ou à 3 dimensions dont les cellules comportent soit de l'information générale (textes, images...), soit de l'information numérique directe ou dérivée de l'extraction d'une base de donnée, soit une formule de calcul.

Le système fonctionne par relaxation. De façon répétitive, le système essaie de calculer la valeur de toutes les cellules représentées par une formule. Chaque cellule est examinée à son tour. Si toutes les valeurs des variables présentes dans la formule sont connues (parce qu'il s'agit d'information numérique directement connue ou d'information calculée dans une autre formule déjà calculée), alors la valeur de la formule est calculée. L'algorithme s'arrête lorsque toutes les valeurs de toutes les formules ont été calculées ou qu'aucun calcul n'a été possible par rapport à l'itération précédente. Dans ce dernier cas, si la valeur de certaines formules n'a pu être calculée, c'est que la définition des formules forme une boucle.

La programmation d'un tableur est donc non procédurale c-à-d que le flux d'exécution du programme est défini implicitement par la définition des formules et non explicitement par une séquence dans un algorithme. Son fonctionnement ressemble donc à celui d'un système à règles (rule based system) qui comprend un ensemble de règles conditionnelles 'si'...'alors'... dont l'enchaînement est calculé dynamiquement lors de l'exécution et non explicitement par un emboîtement statique de condition. De tels systèmes, en règle générale, sont très simples à programmer pour de petits systèmes mais deviennent difficilement gérables lorsque le nombre d'éléments (le nombre de formules ou le nombre de règles) devient trop grand.

Les tableurs traditionnels obligent l'utilisateur à entrer son problème dans le cadre rigide d'une matrice dont chaque case est identifiée par des lettres et des chiffres. La difficulté de ces tableurs est de permettre la modification des tableaux par ajout d'une ligne ou d'une colonne sans devoir réajuster les formules. Pour ce faire, en général les variables dans les formules identifient d'autres cellules par des références relatives et non des références absolues, sauf si l'utilisateur demande explicitement une référence absolue.

70

Certains tableurs dont 'Improv' de LOTUS (maintenant retiré du commerce) se présentent plutôt comme des outils de calcul multidimensionnel. L'utilisateur peut, dans ces systèmes, définir les valeurs des éléments dans un ensemble de dimension en donnant un nom à la dimension et fournissant ses valeurs possibles. Plus de 3 dimensions sont possibles, certains axes représentant alors le produit cartésien de plusieurs dimensions. Ainsi, si l'on souhaite connaître le délai de remboursement d'un emprunt en fonction du taux d'intérêt et de la valeur remboursée mensuelle, il est possible de créer comme dimension le temps (en mois pour un certain nombre d'année), le taux d'intérêt annuel (de pour-cent en pour-cent entre 2 valeurs par exemple entre 5% et 10%) et la valeur remboursée (par exemple de 2500 francs en 2500 francs). Le tableau peut être présenté en donnant le temps en abscisse et en subdivisant chaque valeur selon les taux possibles et en fournissant en ordonnée les montants. Chaque cellule représentera le montant qu'il restera à rembourser. L'intérêt du système est que le calcul peut être exprimé en fonction de la définition des dimensions et non de coordonnées de cellules dont il est difficile de se rappeler ce qu'elles représentent. Ainsi, on pourra avoir comme formule 'montant(temps)' = 'montant(temps - 1)'+ 'intérêt / 12' - 'remboursement mensuel'. Ou bien encore 'montant(somme des temps)' = 'somme des remboursements mensuels' (pour exprimer la somme totale remboursée par l'utilisateur). Ce qui est intéressant aussi dans ce système c'est qu'il est possible de changer aussi ultérieurement la forme de la représentation et par exemple de représenter le temps seulement en abscisse et la combinaison 'intérêt' - 'valeur de remboursement mensuel' en ordonnée après coup sans modifier les formules.

La plupart des tableurs intègrent maintenant des outils de représentation graphique sophistiqués permettant de représenter le contenu des tableaux sous forme de camembert (lorsque la fonction est y = f(x)), d'histogrammes simples, multiples (lorsque la fonction est z = f(x, y)) ou tridimensionnels, de courbes plus ou moins lissées ou de nuages de points. Les outils indépendants qui existaient à une certaine époque pour effectuer ces représentations graphiques ont maintenant presque tous disparu.

Les tableurs intègrent des fonctions assez sophistiquées d'analyse des données:

Un tableur supporte plusieurs feuilles de travail dans le même livre, avec des possibilités de créer des formules opérant à partir de données en provenance de plusieurs feuilles. Cela permet par exemple de créer différentes analyses d'une même source de données, chaque analyse étant dédiée à une feuille.

Certaines tables dites "pivot" permettent d'analyser des listes d'informations. Ainsi, par exemple, si un tableur contient une base de donnée d'inventaire d'équipement informatique (par exemple des PC), chaque ligne pourra contenir l'identification de l'équipement, ses caractéristiques, sa marque, sa localisation, et le département propriétaire. Une table pivot permettra par exemple de compter par département le nombre de PC d'une certaine marque.

71

Les tableurs cherchent aussi à se présenter parfois comme de petites bases de donnée. Pour un utilisateur final, un tel outil peut être intéressant. On n'oubliera cependant pas que le tableur est souvent soumis à d'importantes restrictions dans ce rôle ; il y a tout d'abord des restrictions d'implémentations qui limitent par exemple le nombre de lignes qu'il est possible d'introduire dans la 'base de donnée' ; il y a surtout la restriction de ce que le tableur en temps que base de donnée ne supporte qu'une seule entité (une seule table). Il ne s'applique donc qu'à des bases de données très simples.

Par contre, le tableur est souvent utilisé pour garder le résultat d'une extraction de base de donnée. L'avantage de cet outil est de permettre de retravailler le résultat de l'extraction par exemple en créant des sommes. Ils permettent aussi de faire des dérivations plus importantes, par exemple en utilisant des tables pivots ou des formules sophistiquées d'agrégation dans d'autres feuilles de calculs liées au même livre. Il y a deux techniques pour lier un tableur avec des bases de données:

Il est possible souvent de faire un "copier-coller" entre l'information affichée par l'interface d'accès à la base de données et le tableur ou encore de faire un sauvetage de l'information sous un format "table". Cette approche est une approche statique qui permet de faire de temps à autre une extraction pour créer une nouvelle version des tables. Un des intérêts de la méthode est de créer une version des données extraites sous un format qui peut être associé à un texte et transmis à des tiers par exemple via le courrier électronique. Le tableur devient donc le format idéal pour transporter des données structurées qui doivent être véhiculées électroniquement en association avec d'autres documents.

Il est aussi possible de placer des formules spéciales dans les cases d'une table. Ces formules spéciales peuvent contenir des ordres d'extraction de base de données et s'exécuter à intervalle régulier. Il s'agit là d'un remplissage dynamique des tables où les valeurs sont recalculées à chaque ouverture du fichier contenant les tables.

Les langages de 'macro' déjà mentionnés dans les traitements de texte sont encore plus importants dans des outils de type tableur. Intégrant un véritable langage de programmation de type 'Visual Basic', ils opèrent sur des objets élémentaires tels que des feuilles de calcul, des cellules, des lignes ou des colonnes. Ils permettent de construire de véritables applications qui seront associées aux données. Ils permettent de créer des formulaires facilitant et guidant le travail d'introduction de données, en conjonction avec des règles de validation. Celles-ci permettent par exemple de définir qu'une cellule d'un certain type ne peut contenir que des données extraites d'une liste qui se présente à l'utilisateur sous la forme d'une liste déroulante (drop down).

72

La création des programmes dans ces langages de "macro" est facilitée par son caractère de langage interprété (c-à-d où l'exécution est contrôlée par un programme spécial appelé "interpréteur" capable de signaler à l'utilisateur des erreurs importantes lors de l'exécution en lui permettant d'analyser la situation en détail), l'existence d'outil de mise au point (debogeur) et surtout la possibilité pour l'utilisateur d'enregistrer certaines de ces actions et d'observer la traduction de cet enregistrement dans la génération d'un programme écrit dans ce langage de programmation. Cette dernière possibilité facilite l'apprentissage et permet par exemple de découvrir rapidement les objets, les propriétés et les méthodes qu'il faut utiliser pour obtenir un certain résultat.

La sophistication croissante de ces langages de programmation, leur mise en oeuvre rapide par rapport au délai nécessaire pour construire des bases de données centralisées de type relationnelle, conduit à la construction de systèmes modulaires où l'interface à une base de donnée centrale pour y injecter des données peut être remplacée par l'envoi de tableurs dont les données ont été introduites sous le contrôle de programmes écrits dans ces langages de macro. L'aggrégation des données reçues pouvant être, elle aussi, contrôlée par d'autres macro. On se trouve donc avec une sorte de base de donnée 'portable' et distribuée. Il ne faut cependant pas oublier que, outre les limitations décrites ci-dessus en ce qui concerne la vision du tableur comme une base de donnée, cette approche rencontre deux problèmes:

Tout d'abord, elle ne s'applique que pour les systèmes qui ne nécessitent pas la notion de transactions en temps réel et plus généralement où l'action de l'utilisateur ne dépend pas des valeurs présentes dans la base de donnée à l'instant où il introduit ses données.

Ensuite, cette approche ne s'applique que dans des environnement où l'utilisateur montre une certaine discipline et ne change pas la structure des tables qui lui sont présentées pour remplissage.

La vision du document comme porteur de relations structurées est décrites plus en détail dans la suite de ce chapitre.

1.19. La structuration de plusieurs documents

Pour créer des structures plus complexes que des documents, il est nécessaire de les assembler. Il existe plusieurs techniques d'assemblage de documents ou de création de liens entre documents.

La reliure électronique (binder) consiste à associer plusieurs documents dans une structure plus importante. Celle-ci permet par exemple de garder ensemble un document et ses annexes. Cette structure est importante parce qu'elle permet de créer des associations qui, au contraire des multiples "attachments" qui existent dans la plupart des courriers électroniques, sont permanents. Il est donc possible d'archiver un document en bloc, d'éviter la perte de ses annexes lors de sa manipulation et surtout de l'imprimer en bloc, sans devoir ouvrir chacune de ses composantes et d'en faire l'impression individuelle. La visualisation à l'écran du document est aussi plus facile et la structure globale de celui-ci est bien mise en évidence. Enfin, dans le monde informatique, on peut imaginer une structure de reliure récursive qui permet une plus grande richesse de structuration.

73

L'évolution naturelle de la notion de reliure est le concept de 'dossier'. Un dossier peut être vu de différentes manières:

Il peut être vu comme un outil d'assemblage de document permettant de les transférer par copiage physique en bloc. Il s'agit d'un concept permettant d'imaginer des flux de dossiers entre des personnes ou des stations de traitements chargées de les traiter. Un tel "flux de travail" est examiné plus loin.

Un dossier peut être associé à la structure de stockage que celle-ci soit liée au système de fichiers ou à un outil plus spécialisé comme le courrier électronique ou un système d'archivage spécialisé. Ce point est aussi décrit plus loin.

Un dossier peut être vu comme un attribut commun associé à plusieurs documents, comme par exemple un mot-clef (ou un ensemble de mots-clef extraits d'une liste fermée). La visualisation d'un dossier se fait alors dynamiquement par recherche des documents ayant la même valeur d'attribut. Dans cette approche, comme dans la précédente, le dossier est plutôt vu comme un outil de classement et non comme un outil de circulation d'information.

Enfin, un dossier peut être vu aussi comme un document contenant des liens hiérarchiques vers d'autres documents. Cette approche mène directement à l'étude de la structuration par lien des documents telle qu'elle est bien connue sur INTERNET.

Le format des documents sur INTERNET, le HTML, a déjà été décrit précédemment. Parmi les balises présentes dans un document HTML, certaines permettent d'identifier des liens (ou plus exactement des hyperliens) entre documents. L'endroit où se fait la référence dans un document est appelé le point d'insertion de la référence.

Pour permettre de tels liens de référence entre documents, tout document dans le monde INTERNET possède une adresse unique qui permet de le localiser. Cette adresse au niveau mondial, identifie souvent tout d'abord la machine sur laquelle est stocké le document via l'identification du réseau de raccordement de cette machine et ensuite du nom local de cette machine par rapport à son réseau de raccordement. Au sein de la machine, cette adresse identifie ensuite un répertoire dans lequel est stocké le document. Le document est lui-même identifié dans le répertoire par son nom. Cette adresse d'un document s'appelle le 'URL' (Uniform Resource Locator) et, en fait, elle est arbitraire. La seule contrainte est que chaque élément de l'adresse soit utilisable par l'élément précédent pour raffiner la localisation du document.

Grâce aux hyperliens sous INTERNET, il est possible de naviguer de documents en documents. A la limite, l'ensemble des documents existants au monde sur INTERNET forme un gigantesque document dont les parties sont reliées entre elles par les hyperliens. A noter qu'un URL peut être statique (la référence directe d'un document à un autre) ou il peut être dynamique. Dans ce cas, une partie du URL précise une condition que doit satisfaire un ou plusieurs documents (qui devront alors être concaténés) et s'exprime sous la forme d'un 'query' compréhensible par l'élément de l'adresse précédent.

74

Un système d'annotation est aussi un système d'hyperliens. La seule différence entre un hyperliens normal (utilisé pour référencer d'autres documents) et une annotation concerne le propriétaire du point d'insertion. Dans un document hypertext normal, le point d'insertion appartient à l'auteur du document. Dans une annotation hypertext, le point d'insertion appartient à l'auteur de l'annotation.

Un système d'annotation est très important en bureautique. Il est en effet très rare qu'un document (ou une partie de document s'il s'agit d'un document élaboré par plusieurs personnes, chaque personne étant responsable d'une partie) soit réellement 'révisable' par plusieurs personnes. La révision d'un document (ou de parties de documents) par plusieurs personnes, chacune pouvant le modifier est la meilleure façon d'arriver à des versions incohérentes même si le document suit un ordre de circulation bien défini (en effet dans ce dernier cas, le document peut devenir instable, chaque intervenants modifiant le travail que le précédent a effectué). La raison de ces problèmes est que les modifications apportées par les différents intervenants ne sont pas nécessairement additives (un intervenants peut détruire ce qu'un autre a fait).

En général, il est préférable que chaque intervenant, même s'il a plus de pouvoir que l'auteur du document, ne puisse pas modifier le document mais seulement l'annoter. Le document après circulation (en boucle unique ou en une série de boucle parallèle pour accélérer la circulation) revient annoté chez l'auteur qui peut alors effectuer la synthèse des annotations et remettre ensuite le document en circulation.

Les seuls cas où un document peut réellement être modifié par plusieurs personnes est lors de son passage par une chaîne éditoriale. Là, chaque intervenant a un rôle bien défini dans la chaîne d'édition et il peut effectuer son travail sans fournir de 'feedback' à l'auteur ou à un autre membre qui l'a précédé dans la chaîne d'édition.

Les hyperliens sur INTERNET sont non qualifiés, c-à-d qu'il n'existe pas un 'sujet' propre au lien. Dans certaines bases documentaires, les hyperliens sont qualifiés. Cela signifie qu'il existera par exemple dans un ensemble de textes juridiques des liens qui donnent l'enchaînement des modifications des textes de loi, des liens qui expriment la mise en œuvre d'une loi par une autre loi, des liens qui expriment l'équivalence de 2 lois (par exemple dans des pays différents ou dans des états différents d'un état fédéral) et ainsi de suite. Le fait d'ajouter une sémantique au lien l'enrichit et le particularise. Il permet son exploitation automatique par des systèmes d'information.

1.20. Décomposition d'un document en bloc

A l'inverse de l'assemblage d'un document en bloc, on peut aussi décomposer un document en blocs et exploiter cette division de façon utile. La structuration en bloc offre des possibilités importantes en matière de partage et de contrôle d'accès.

75

Les possibilités de partage sont bien connues ; elles permettent à plusieurs documents de contenir chacun le même bloc identifié par référence à une description unique. La modification de cette description dans un des documents se reflète immédiatement dans les autres documents. Le partage d'un même bloc par plusieurs documents différents pose le problème de la localisation des blocs. Si les blocs communs ne bougent pas de place, il est possible de les localiser par une adresse semblable à un URL. Le déplacement des documents ne posera alors pas de problèmes. Si les documents et le bloc référencés changent tous simultanément de place en gardant leur position relative, il est possible pour les documents de référencer les blocs de façon relative. Par contre si le bloc change de place sans modification corrélée des documents qui y font référence, l'adresse que ceux-ci contiennent deviendra erronée. Il faut alors que la référence des documents au bloc commun se fasse via un nom et non plus une adresse c-à-d une identification du bloc indépendante de sa localisation. Un service de répertoire doit alors permettre la traduction entre le nom et l'adresse. Lorsque que le bloc change de place, il notifie au répertoire son changement de localisation.

Ce problème de relation entre un nom et une adresse se pose aussi lors des références croisées de liens hypertext et de façon générale, ce problème apparaît dès que l'on opère en environnement 'distribué' où les ressources sont à des endroits différents et variables, ce qui est très souvent le cas en bureautique. Ce problème de répertoire nom-adresse est donc un problème très important en bureautique et il est abordé plus loin.

Pour pouvoir gérer le partage de blocs ou garantir la confidentialité de partie de documents, chaque bloc peut contenir des éléments de contrôle d'accès au bloc. Chaque bloc contient alors des informations précisant qui a accès au bloc et pour quelles opérations. Ces possibilités de protection au niveau du bloc ont 2 grands types d'application:

Tout d'abord, ce mécanisme de protection favorise l'élaboration d'un document complexe par différents auteurs travaillant de façon coordonnée sur des parties différentes du document. Initialement, un responsable crée la table des matières du document et définit les responsables des différentes parties. Il attribue à chaque partie un mot de passe différent qui devient nécessaire pour éditer cette partie et ensuite il communique le mot de passe correspondant à chaque responsable d'une partie. Le document peut alors être placé sur un 'serveur de document' où chaque coauteur peut en extraire la 'dernière' version, l'éditer et remettre sur le serveur. On peut aussi procéder par diffusion du document par courrier électronique ou disquette, édition par chaque responsable de façon indépendante et simultanée et réconciliation périodique par la personne responsable de l'ensemble du document. Le point important est que via cette division du document en bloc (partie) protégé individuellement, le logiciel est capable d'importer une nouvelle version du document et de mettre à jour automatiquement les différentes parties en gardant la plus récente (identifiée par un numéro de version attribué à chaque partie et incrémenté automatiquement par le système à chaque édition).

76

Ensuite, le mécanisme de protection permet la création de documents destinés à plusieurs type de destinataires. Dans ce mode d'utilisation, à chaque partie est attribué un label de sécurité (un nombre). A chaque label est associé un mot de passe et le document est encrypté au moyen d'une clef secrète qui est liée au programme de lecture (alternativement, on peut associer à chaque niveau des clefs d'encryption différentes). Lorsqu'un utilisateur veut lire le document, il doit présenter le mot de passe correspondant au niveau auquel il veut lire le document. Seul les parties de document dont le label est un nombre plus petit ou égal au label correspondant au mot de passe sont accessibles au lecteur. S'il ne présente pas de mots de passe, le label '0' est utilisé. Ce label permet l'accès aux parties complètement publiques du document (si elles existent). Cette protection permet de créer un seul document qui peut contenir des parties plus ou moins confidentielles. Il n'est pas nécessaire de créer alors des documents différents suivant les 'publics' et d'assurer une synchronisation entre les versions des documents. Bien entendu, le format du document doit être assez riche pour que le lecteur ne se rende même pas compte que des parties du document lui sont cachées (de façon à ne pas exciter sa curiosité ou faire naître des spéculations). Les possibilités de générations procédurales tels que la numérotation automatique des pages, des paragraphes et des chapitres ou encore la génération automatique des tables des matières et des index, jointes à l'expression des contraintes adéquates en ce qui concerne la mise en page (localisation dynamique des notes en bas de page, règle en matière de saut de page) et à certaines règles spécifiques liées à ce type d'utilisation (suppression des chapitres dont tous les paragraphes sont supprimés, transformation en textes normaux de listes dont un seul élément est accessible) rendent la création de tels documents 'sélectifs' tout à fait possibles. Bien entendu, la représentation du texte sur disque ou en mémoire doit être encryptée pour éviter des accès qui contournent la protection. De façon similaire, des techniques de compression doivent réduire la taille du document afin que les utilisateurs qui n'ont que des droits d'accès restreints ne s'apperçoivent pas qu'ils n'ont accès qu'à une partie de l'information.

Ces 2 techniques peuvent être combinées pour créer des documents élaborés par différents auteurs qui n'ont pas forcément tous le droit d'avoir une vue complète du document créé.

1.21. Le document comme interface à des bases de données structurées

Une base de données structurée est une base de donnée dans laquelle les informations sont représentées dans des tables. Ces tables peuvent représenter des objets (des entités) et des relations entre ces objets.

Ainsi par exemple une table représentera un ensemble de personnes:

Table "Personne"

Numéro d'identificatio

n

Nom Prénom Age Sexe

5 Bertrand Philippe 54 M

643 Labay Corine 25 F

77

… et une autre table représentera par exemple un ensemble de véhicules:

Table "Véhicule"

Identification Marque

6634 Renault Clio

6543 Nissan Terrano

Chacune de ces tables identifie un objet par un numéro d'identification arbitraire.

Ces deux entités (personne, véhicule) pourront être mises en relation via une relation de type "être propriétaire d'un véhicule". Cette relation pourra être représentée par la table

Table "Propriétaire"

Numéro d'identification Identification

5 6543

643 6634

… exprimant que Philippe Bertrand est propriétaire d'une Nissan Terrano.

Un document pourra être un "rapport" extrait de la base de données. Ce rapport voudra par exemple afficher des informations associant à chaque personne le véhicule dont il est propriétaire.

La définition d'un tel document se fera via un ordre de recherche exprimé dans un langage tel que le SQL (Structured Query Language), un langage utilisé très fréquemment avec des bases de données relationnelles. L'ordre de recherche sera par exemple du type

SELECT Nom, Prénom, MarqueFROM Personne, Véhicule, PropriétaireWHERE (Personne.Numéro d'identification = Propriétaire.Numéro d'identification) AND(Véhicule.Identification = Propriétaire.Identification)

Le résultat de cette sélection sera un tableau qui pourrait être décrit par un ensemble de balise de type XML.

Il restera à définir un style dans un langage de type XSL pour avoir le document résultat sous forme de tableau rectangulaire ou de liste de multiplets du type.

Propriétaire: Philippe BertrandVéhicule: Nissan Terrano

Propriétaire: Corine LabayVéhicule: Renault Clio

78

En général, de tels documents sont construits par le créateur d'un système d'information en utilisant des outils spécialisés de "reporting". Parfois, l'utilisateur final qui a accès à une telle base de donnée peut construire lui-même ses rapports.

De tels rapports peuvent être affichés à l'écran et imprimés. Parfois aussi, leur contenu peut être transférer dans un tableur ou plus rarement dans un traitement de texte. Souvent cependant, le transfert vers de tel outil s'accompagne d'une dégradation de la mise en page.

Il est a noter aussi que la construction d'un système d'information consiste en la création d'un ensemble de tels rapports, utilisés soit pour afficher de l'information extraite de la base de donnée, soit pour permettre l'introduction de nouvelle information dans la base. Construire un nouveau système d'information devient en partie un travail de création de documents.

Dans certain cas, il serait souhaitable qu'un rapport se manifeste non pas comme un seul document mais bien comme une hiérarchie de documents intégrés dans la hiérarchie de classement d'une arborescence de stockage (comme un système de répertoire et de fichiers). Si un rapport montre les ordres de paiements qui ont été émis dans les 3 derniers mois, il peut être intéressant de les montrer non pas sous forme de liste dans un document unique mais bien sous la forme d'un répertoire de document, chaque document correspondant à un ordre de paiement. Un ou plusieurs champs produit par le rapport servira de nom du document dans le répertoire, comme dans l'exemple cité, le numéro du paiement, sa date et/ou le libellé apparaissant sur le formulaire de virement. En parcourant son répertoire, l'utilisateur pourra alors rencontrer des documents réels et de tels rapports dont le contenu sera obtenu dynamiquement au départ de l'extraction d'une base de donnée relationnelle.

Bien que l'on puisse les qualifier de "document", les rapports formés dynamiquement par extraction d'une base de données structurée sont particuliers en ce sens que la structure riche de leur représentation est située au moins pour partie dans un endroit distant. Cette structure riche est formée en effet des données qui sont situées dans la base de données et de l'instruction de recherche (query SQL) qui définit les données qui doivent en être extraites. En général, la base de données est située dans un endroit où toutes les données d'une organisation sont centralisées. Le document n'a en fait pas d'existence tant qu'il n'y a pas d'association entre les données distantes, l'instruction de recherche et le style de mise en page. Seule sa transformation sous une forme plus pauvre (image "pixel" destinée à l'impression ou transformation dans une table d'un tableur) peut être traitée comme un vrai document c-à-d par exemple être stockée ou transportée par courrier électronique. Il faut d'ailleurs aussi remarquer que la construction d'un système d'information consiste pour l'essentiel à créer un ensemble de tels documents permettant de visualiser et de mettre à jour le contenu d'une base de donnée.

79

Les bases de données structurées sont des outils puissants, utilisés dans la plupart des entreprises pour gérer des masses d'information structurées de façon complexe. Un système d'information dans une grande entreprise peut parfaitement contenir plus de 1000 tables, ce qui rend difficile la maîtrise de l'ensemble. Plus grave, si plusieurs groupes développent de façon indépendante des systèmes d'information (par exemple une gestion d'inventaire et une gestion financière), ces groupes risquent de définir des entités similaires (par exemple les employés de l'entreprise qui gèrent le matériel ou les finances) mais de les organiser dans des tables qui n'ont pas la même description. Il est alors nécessaire de copier périodiquement les informations d'un système (maître) à un autre (esclave).

Pour arriver à maîtriser cette complexité, une approche qui sera sans doute suivie à l'avenir sera de découper les entités des bases de données en objet et de structurer ces objets via des règles de classification ou d'aggrégation. On pourrait alors associer ces objets à des représentations permettant leur mise à jour (création de nouveaux objets de ce type) et leur visualisation. Ces objets pourraient être dupliquer et transporter comme des mini-bases de données structurées (ou des super-tables de tableurs). Les relations entre ces objets pourraient être faits par des hyperliens, capables, comme les hyperliens d'INTERNET, de maintenir des références entre des objets et des entités situés à des endroits très distants. Construire un système d'information consisterait à assembler de tels composants dont la modularité permettrait la réutilisation. Ce style d'approche où le document serait composé de l'association entre des composants constitués de mini bases de données structurées assemblés entre eux par les techniques utilisées dans le domaine des documents multimédias et dans le domaine des documents hypertextes.

1.22. Formulaires et agendas

Une application plus prosaïque de ces concepts se retrouve dans l'agenda. Un agenda personnel est une structure spécialisée destinée à enregistrer des informations liées aux mois, semaines, jours et heures. Couplés à l'horloge d'un PC, ils peuvent donc aussi présenter à tout moment les tâches à exécuter, les réunions et ils offrent un système d'alarme sonore. En fait, il s'agit d'une petite base de donnée spécialisée.

Un agenda partagé peut d'ailleurs est réalisé par un système de donnée relationnelle. Le problème cependant est qu'un agenda doit être facilement transportable pour par exemple pouvoir être amené avec soi sur son portable ou son palmtop. Aussi l'implémentation en est elle fréquemment tout à fait différente. En effet, l'agenda partagé est basé sur une base de donnée portable dont le contenu peut être synchronisé avec celui d'autre agenda via des outils de communication tel que le courrier électronique.

80

L'introduction d'agendas électroniques partagés dans une organisation demande un grand soin. Les agendas électroniques partagés ne sont en effet efficace que si toute les personnes qui appartiennent à l'organisation les utilisent. Ils posent aussi des problèmes de gestion des rapports entre les personnes, rapports régis par des règles informelles qu'une informatisation sans nuances risque de bousculer. Le temps est en effet une ressource complexe et sa gestion est au cœur de l'équilibre qui s'établit entre les membres d'une organisation. Un agenda électronique partagé, quelque sophistiquées que soient ses techniques de création de zones 'publiques' et de zones 'privées' dans l'emploi du temps de chacun n'est certainement pas un outil neutre dont l'acceptation est aisée. De plus, comme tout outil qui travaille sur un ensemble de données partagées, il demande une gestion correcte de la part d'un administrateur soigneusement formé.

Le logiciel de formulaire électronique est aussi lié aux bases de données structurées. Le but d'un tel logiciel de formulaire électronique est de permettre la saisie structurée d'information 'off line' de façon à pouvoir remplacer les formulaires 'machines à écrire' et alimenter des bases de données.

Dans ce dernier rôle, les formulaires électroniques rencontrent de nombreux problèmes. En effet, l'injection automatique des données contenues dans le formulaire dans une base de donnée ne peut se faire que si les données ne contiennent pas d'erreur. Cela suppose que le logiciel de formulaire doit être capable de guider les utilisateurs dans le remplissage des cases du formulaire de façon à minimiser les cas de rejets. Ce travail d'aide suppose souvent de placer un bon nombre de données dans le formulaire et surtout de synchroniser l'ensemble des valeurs proposées à un utilisateur avec l'ensemble des valeurs acceptées par la base de données, même lorsque le contenu de celle-ci évolue. Les progrès en matière de réseaux de télécommunication, les problèmes de synchronisation entre formulaires et base de donnée et la lourdeur qu'implique le processus de traitement de formulaires qui doivent être rejetés parce que remplis incorrectement fait que cette solution est en pratique peu employée et que la plupart des formulaires électroniques sont en fait l'interface utilisateurs à des systèmes d'information opérant sur des bases de données (le plus souvent relationnelles) (comme décrit dans le chapitre précédent).

Quant au simple remplacement de machines à écrire par des formulaires électroniques, il amène vite l'utilisateur à réclamer le stockage puis l'exploitation des données emmagasinées par de tels formulaires c-à-d, en fait, à réclamer la construction d'un système d'information... On comprend mieux pourquoi le marché des logiciels de gestion de formulaires (non liés 'on line' à un système d'information) existe depuis longtemps mais reste un marché de niche. Il faut d'ailleurs souligner qu'un tableur permet souvent de construire des formulaires 'portables' (qui peuvent être transmis par courrier électronique par exemple) via le langage de macro. Il est aussi possible de créer des petits systèmes d'information personnels permettant de stocker dans des petites bases de données plus ou moins relationnelles les données introduites dans le formulaire.

1.23. Des documents programmes

D'autres évolutions sont possibles en matière de documents. Une des tendances est de construire des documents qui sont de véritables programmes et donc dont tout ou une partie est construite de façon procédurale.

81

La numérotation automatique des pages et des paragraphes et l'extraction automatique d'une table des matières ou d'un index sont des exemples très simples de génération procédurale de morceaux de documents à partir de morceaux préexistants. Comme déjà mentionné, il est par exemple aussi possible dans la plupart des tableurs de charger leurs cellules à partir du contenu de bases de données externes via l'inclusion d'ordre SQL effectuant l'extraction d'une base de donnée relationnelle. Ceci, joint au calcul interne dans les cellules, permet de transformer un tableur en une 'coquille' capable d'afficher des données qui changent avec le temps.

Plus sophistiqués, de nombreux documents contiennent des éléments de programmation permettant de créer des animations. Ces animations sont généralement crées avec des langages de script, tels Javascript, dont le code peut être contenu dans des pages HTML. Alternativement, ces pages HTML peuvent faire référence à des programmes externes créés par exemple en Java qui peuvent aussi créer des animations dans la page qui a demandé leur exécution (applet Java). Ces animations sont souvent destinées à attirer l'attention du lecteur ou à véhiculer des publicités. Ces langages de scripts, comme déjà mentionnés, permettent aussi de créer des documents capables de contrôler leurs propres mises à jour.

De façon similaire, un document peut comprendre des composants "ActiveX". Ces composants ont une représentation visuelle, des propriétés dont les valeurs reflètent (et parfois peuvent influencer) la représentation visuelle, des méthodes qui sont des appels de procédures qui peuvent influencer de façon complexe le composant et des événements qui reflètent des changements que l'utilisateur a produit sur le composant (par exemple cliquer sur une partie du composant). Au moyen d'un langage de programmation du type "Visual Basic", il est possible de créer des programmes complexes qui gèrent l'interaction entre composants.

Une autre classe de document intéressante est la classe des documents 'agent'. Conceptuellement, de tels documents contiennent des informations de routage leur donnant des règles pour passer par différents nœuds d'un réseau tel qu'un réseau INTERNET. A chaque station, le document est capable de poser des questions au nœud et de collecter des réponses. A la fin de son tour, il reviendra à son point de départ après avoir collecté toutes les réponses reçues à sa requête. Ainsi, il sera possible de créer un document chargé de trouver toutes les entreprises vendant du matériel informatique, situées en Belgique et acceptant certains moyens de paiements, de leur demander le prix d'un matériel donné et de retourner la réponse à l'expéditeur. Un agent encore plus sophistiqué pourrait même passer une commande.

Pour que de tels agents puissent être utilisés en pratique, il faut une standardisation des langages d'agent et des mécanismes de recherche des sites intéressants et des questions à poser à chaque site. Lorsque l'agent est capable de prendre des actions comme une commande, il sera nécessaire de mettre en place des protections particulièrement fortes en matière de signature électronique et de confidentialité.

82

1.24. Sécurité et signature

Un document papier peut être protégé en étant placé dans un endroit contrôlé. Sa transmission d'un endroit sécurisé à un autre peut être fait en l'enfermant dans une enveloppe. L'enveloppe ne sécurise pas vraiment un document en temps que tel. Mais elle le banalise (un enveloppe d'un document 'secret' peut avoir la même apparence que l'enveloppe d'un dépliant publicitaire) et surtout elle permet de s'assurer que le document n'a pas été accédé durant le transfert. Un document de très haute confidentialité, utilisant des moyens de transport peu sûr peut être codé (encrypté). La méthode a l'avantage de la sécurité ; par contre, elle réclame un décryptage à l'arrivée qui est long et est lui-même un point faible dans la chaîne de sécurité.

Le secret d'un document électronique peut être gardé de façon similaire en protégeant son accès. Il peut être gardé dans des systèmes de fichier sécurisés ou des serveurs documentaires. Comme cas extrême, il peut être gardé sur des disquettes qui supportent le même type de protection que le papier. A la limite, si 2 correspondants doivent échanger un document, l'échange peut être fait par un accès au même serveur et non par transfert physique du document d'un endroit à l'autre, un peu comme si tous les gens qui devaient avoir accès au document devait se rendre au coffre fort où il est gardé et se contenter de le lire sur place. Un document électronique semblerait en fait être plus facile à protéger qu'un document papier...

Et pourtant, comme chacun le sait, ce n'est pas vraiment le cas. La raison en est simple.

Ou bien, un document est situé sur un PC qui appartient à un utilisateur. Ce PC peut être alors vu comme le coffre fort propre de l'utilisateur. Mais c'est un coffre fort personnel et la transmission d'un document à un autre utilisateur implique nécessairement son copiage à travers un réseau plus ou moins public.

Ou bien le document est sur un serveur (système de fichiers ou serveur documentaire). Et dans ce cas, tous les utilisateurs, pour accéder au document, en font nécessairement des copies partielles sur leur terminal ou leur PC à travers un réseau public (c'est un peu comme si l'accès au coffre fort n'était pas possible mais qu'il était juste possible de demander à un gardien d'envoyer des extraits de documents pour consultation).

Or l'utilisation de réseau de transmission électronique est beaucoup plus vulnérable aux indiscrétions que la poste manuelle (qu'elle soit privée ou publique) pour au moins 4 raisons :

La prolifération des réseaux informatiques et leur structure de transmission 'par paquet' (expliquée dans les chapitres de description technique de l'infrastructure) rend plus difficile de contrôler l'endroit par lequel passe l'information. Lors de la transmission d'un document, certaines parties du document peuvent transiter par des chemins très différents en fonction de conditions peu contrôlables tel que la densité de trafic à un certain endroit. Certains de ces nœuds de passage peuvent être indiscrets…

83

Les réseaux informatiques ne sont pas nécessairement aussi bien contrôlés que les réseaux postaux. Bien sûr, il existe des réseaux dont les caractéristiques de sécurité sont bien définies tel que le réseau SWIFT qui lie les différentes banques pour la transmission des fonds. Mais ces réseaux sont souvent des réseaux 'fermés', limités à un petit club d'adhérents et, en fait, eux-mêmes ont dû mettre en œuvre des techniques sophistiquées, légales, contractuelles et techniques pour se protéger de leurs 'transporteurs physiques d'information' (les organisations auprès desquelles, les gestionnaires de ces réseaux louent les lignes physiques ou les liaisons satellites). Mais de nombreux autres réseaux dont le plus connu est INTERNET ne sont tout simplement contrôlés par personne. Les machines qui effectuent le routage des messages appartiennent à des organisations tels que des universités qui n'ont pas de politique stricte de sécurité et qui, en tout cas, n'acceptent aucune responsabilité si un message est intercepté lors de son passage dans leur domaine.

Dans le monde des transmissions électroniques, il est beaucoup plus facile d'intercepter des messages en grande quantité au moyen d'automates qui, de façon routinière, examinent tous les messages qui transitent à leur voisinage et copient ceux qui semblent intéressants (par exemple qui contiennent des mots appartenant à une liste de mots clés tel que 'défense', 'secret', 'missile' ou qui examinent la structure de l'information tel que la structure '4 chiffres, -, 4 à 6 chiffres, -' 4 ou 5 chiffres' d'une carte de crédit). Par comparaison, l'examen de toutes les lettres (sur papier) passant par un tri postal demanderait pas mal de ressources et de temps.

Et surtout, il n'y a pas de mécanisme naturel d'enveloppe dans la transmission électronique. L'examen du courrier ne laisse pas de trace et l'accès au contenu de l'information est immédiat (pour être tout à fait correct, il faut cependant ajouter que la diversité des descriptions possibles électroniques rend un peu plus difficile le processus de lecture de l'information électronique). Et si même l'examen du courrier laissait des traces, comme de nombreux utilisateurs des réseaux sont anonymes et utilisent des noms fictifs, il est difficile de trouver le responsable d'une violation du secret du courrier.

Par contre, l'information électronique est facile à encrypter et décrypter. L'encryption n'est qu'une suite de transformations mathématiques que les machines font beaucoup plus rapidement et sans erreur que les êtres humains. C'est donc ces techniques qui ont été utilisées pour assurer la sécurité de la transmission et du stockage des documents.

84

Pour éviter que le point faible de la chaîne de sécurité ne soit précisément le processus d'encryption et de décryption, tous les systèmes d'encryption modernes sont basés sur des algorithmes publics. Le processus utilisé par l'encryption/décryption n'est donc pas caché dans un mécanisme mystérieux dont la connaissance permettrait l'accès au document. La publicité du mécanisme permet aussi, paradoxalement, d'assurer l'efficacité de protection du mécanisme d'encryption. En effet, le mécanisme étant public, il existe de par le monde des milliers de gens qui ont analysé les algorithmes proposés et essayer d'y trouver des failles. Dès qu'une telle faille est découverte, elle devient immédiatement publique et elle permet aux gens ayant à protéger des documents de prendre des mesures adéquates pour corriger les problèmes mis en évidence. Il faut noter que les algorithmes utilisés sont souvent établis sur base de principes mathématiques solides et que la seule façon réelle de 'briser' ces algorithmes ne peut provenir que d'une avancée significative dans certains domaines mathématiques (tel que la théorie des nombres premiers).

Comme les algorithmes sont publics, le 'secret' de l'encryption est dans la clef qui est utilisée dans l'encryption et la décryption. Pour reprendre l'analogie avec le coffre fort, on peut dire qu'un document encrypté est un document mis dans un petit coffre fort. Un document décrypté est le document sorti du coffre fort. L'envoi d'un document encrypté sur un réseau est l'envoi du coffre-fort. Le coffre fort est protégé par une serrure (l'algorithme d'encryption). Le mécanisme de cette serrure est public (comme dans les serrures normales). Et la clef n'est autre qu'un objet pris 'au hasard' parmi une multitude d'objets similaires (une clef d'une forme bien définie prise parmi toutes clefs possibles). Elle doit être suffisamment complexe pour qu'il soit pratiquement impossible qu'une clef prise au hasard puisse fonctionner.

L'encryption informatique fonctionne sur la même base ; la clef est un nombre parmi tous les nombres possibles. Il doit être suffisamment grand pour qu'il soit impossible 'par hasard' de le retrouver même en programmant un ordinateur pour essayer toutes les combinaisons possibles. L'encryption via le nombre choisi, consiste en fait, à placer une serrure particulière correspondant à la clef choisie sur le coffre fort (on peut changer de serrure pour chaque document mais bien sûr cela impose une gestion des clefs), d'y mettre le document et de refermer la porte en utilisant la clef.

A partir de là, on a deux grandes variantes :

85

Dans les algorithmes d'encryption simple dit 'à clef secrète' comme le DES, pour ouvrir le coffre fort (c-à-d pour décrypter), il suffit d'avoir la même clef que celle qui a servi pour faire l'encryption. Ces algorithmes sont ceux utilisés pour faire l'encryption lors de la transmission de documents. Il suffit de communiquer la clef au destinataire pour que celui-ci puisse décrypter le document. La gestion de ces clefs est difficile. Il ne faut pas en effet que ces clefs puissent être interceptées. Moins volumineuses que les documents, elles peuvent être aussi envoyées par d'autres canaux mieux protégés (par exemple la poste normale). On peut aussi effectuer de la protection en cascade et encrypter l'envoi des clefs. La clef d'encryption pour cette encryption de second niveau n'est alors changée que peu fréquemment et sa distribution peut faire l'objet de protection extrêmement sévère (il faut se rappeler que de toute façon une protection absolue est illusoire et qu'il faut surtout faire en sorte que le coût de violation du secret soit plus important que le bénéfice que l'on peut en retirer). Plus efficace encore, cette encryption des clefs secrètes peut être faite par un algorithme à clef publique selon un schéma expliqué plus loin. Un point important pour un algorithme à clef secrète est que l'examen d'un ensemble important de texte encrypté avec la même clef ne doit pas permettre de retrouver la clé même en connaissant certaines particularités du texte encrypté (par exemple la régularité statistique d'un texte dans une langue donnée).

Dans les algorithmes d'encryption à clef 'publique', la clef pour ouvrir le coffre (donc pour décrypter) est une clef différente de la clef ayant servi à le fermer (donc à l'encrypter). Les 2 clefs sont définies simultanément lors de la pose de la serrure sur le coffre. L'algorithme est dit à clef publique parce qu'une des 2 clefs est habituellement publique alors que l'autre est secrète. Si ces algorithmes sont utilisés pour protéger la transmission d'information, la clef publique est utilisée pour l'encryption et la clef secrète est utilisée pour la lecture du document. Ces algorithmes servent aussi pour la signature électronique. Ces 2 modes d'utilisation sont expliqués un peu plus loin. Le point important pour la sécurité de ces algorithmes est que même en connaissant l'algorithme d'encryption/décryption, même en connaissant l'algorithme de production des clefs et même en connaissant la clef publique et un ensemble de textes encryptés, il doit être impossible en pratique, avec les moyens de calcul actuel de retrouver la clef secrète. Ces algorithmes sont en général basés sur des propriétés des nombres premiers et notamment sur le fait qu'il n'existe pas de manière simple de factoriser une nombre très grand en nombre premier. La clef publique est le produit de 2 nombres premiers très grands, la clef secrète est un de ces nombres et l'algorithme d'encryption/décryption s'arrange pour donner le même résultat si on emploie une clef pour l'encryption et une autre clef qui est le produit de cette clef par un nombre premier pour la décryption. Les algorithmes à clef publique sont puissants mais lents à l'exécution. Ils ne peuvent pas encrypter de gros volumes d'information.

Les algorithmes à clefs publiques (tel que le RSA) sont utilisés pour la signature électronique. Comme cela a été mentionné dans le chapitre décrivant les propriétés du papier, les qualités attendues d'une signature sont les suivantes :

Authenticité ; par sa signature l'auteur s'assure que son document reste authentique, c-à-d dire qu'il ne subira aucune altération même lorsqu'il sera passé sous le contrôle du destinataire.

86

Non répudiation ; lorsqu'il reçoit le document signé, le destinataire est sûr qu'il ne peut être répudié par l'auteur et que celui-ci prend donc la responsabilité de son contenu.

La gestion de la signature est souvent complexe dans une organisation. La responsabilité qui est liée à la signature peut permettre de valoriser une personne mais lui fait prendre aussi un risque. Il est en tout cas important que les documents électroniques respectent les mêmes contraintes en matière de signature que les documents papier.

La signature électronique est basée sur le fait pour l'auteur de signer le document simplement en écrivant son nom et d'attacher au document un 'indicateur de modification' qui dépend du contenu du document et qui ne peut être produit que par l'auteur mais qui peut être validé par les destinataires au moyen d'un instrument fourni par l'auteur. Parce qu'ils arrivent à valider le document reçu par l'instrument fourni par l'auteur, le destinataire est sûr de la provenance du document. Parce que lui seul est capable de produire l'indicateur de modification, l'auteur est sûr que le document ne peut être modifié.

Le principe mis en œuvre en pratique est le suivant. L'auteur écrit son nom en temps que signataire sur le document. Sur base du document, l'auteur produit ensuite un 'checksum' c-à-d un nombre de contrôle dont la valeur dépend de façon complexe de toutes les informations présentes dans le document. Ce 'checksum' est produit par un algorithme public (usuellement un algorithme de division polynomiale). L'auteur encrypte alors ce checksum via la clef secrète d'un algorithme à clef publique et attache le résultat de cette encryption au document. Ce résultat est l'indicateur de modification. Il dépend du contenu du document comme l'est le checksum ; il ne peut avoir été produit que par l'auteur puisque lui seul connaît la clef secrète.

Le destinataire, lui a la clef publique qui correspond à la clef secrète. Il l'a reçu de l'auteur via un acte officiel souvent via l'intermédiaire d'un organisme qui assure une fonction de notaire. Il va s'en servir pour décoder l'indicateur de modification et retrouver le checksum. Il peut ensuite valider que ce checksum est bien le même que celui qu'il trouve en effectuant le calcul à partir du document au moyen de l'algorithme public. L'identité du checksum calculé et de celui encrypté accompagnant le document garanti la non répudiation puisque la clef publique fournie par l'auteur ne fonctionne qu'avec la clef secrète que l'auteur a utilisé (et qu'il est donc impossible pour un autre que l'auteur de produire un checksum encrypté qui soit décryptable correctement par la clef publique). L'auteur, lui, est sûr que le document ne peut être modifié par le destinataire puisqu'il est impossible à celui-ci de produire un checksum encrypté décodable avec la clef publique.

Le mécanisme décrit ci-dessus fonctionne mais sa gestion des clefs est complexe. Pour gérer les clefs, les auteurs peuvent enregistrer leur clef publique auprès d'un organisme qui va jouer le rôle de notaire. Un auteur qui veut signer un document va générer les deux clefs (la clef privée et la clef publique). Il va ensuite envoyer la clef publique à l'organisme notaire en l'encryptant via une clef publique qui lui a été fournie par l'organisme lorsqu'ils ont signé un contrat les liant. L'organisme actant comme notaire va décrypter la clef transmise avec sa clef privée et ainsi s'assurer de l'identité du fournisseur de clef et ensuite la publier pour utilisation par les destinataires des documents signés.

87

Un organisme actant comme notaire va pouvoir aussi reconnaître d'autres organismes actant comme notaire et accepter comme valide l'identification des clefs publiques détenues par cet autre notaire. Ces accords de reconnaissance mutuelle permette à un utilisateur de ne signer un accord qu'avec un seul organisme actant comme notaire et d'envoyer des messages signés à un destinataire qui a pris un accord avec un autre organisme actant comme notaire pour autant qu'il y ait une chaîne de reconnaissance mutuelle entre ces deux organismes.

Un organisme actant comme notaire peut aussi aider à résoudre le problème de la gestion des clefs d'encryption utilisé pour protéger le document pendant sa transmission. En effet, dans le cas de l'encryption d'un document via un algorithme à clef publique, le destinataire doit signaler aux personnes intéressées à lui transmettre des documents quelle est la clef publique à utiliser pour effectuer l'encryption. Il peut publier cette information via l'organisme actant comme notaire. Bien entendu, lui seul pourra décrypter l'information puisque lui seul connaît la clef secrète capable de faire la décryption.

En pratique, cependant, comme un algorithme à clef publique n'effectue pas très rapidement son encodage, il ne peut être utilisé pour effectuer l'encryptage d'un document de volume important. Aussi, encrypte-t-on d'habitude un document via la clef d'un algorithme à clef secrète. Cette clef est ensuite elle-même encryptée via la clef publique d'un algorithme à clef publique et jointe au document. Cette clef publique a été publiée par le destinataire via l'organisme actant comme notaire. A la réception du document, le destinataire peut utiliser la clef secrète de l'algorithme à clef publique pour trouver la clef qui a servi à encrypter le document via l'algorithme à clef secrète et effectuer la décryption via cette dernière clef.

En cas d'envoi multi-destinataire, le schéma présenté peut être légèrement modifié afin d'envoyer séparément le document encrypté avec la clef secrète de l'algorithme à clef secrète (cette clef et donc le document encrypté seront identiques pour tous les destinataires) et la clef secrète elle-même encryptée via la clef publique fournie par chaque destinataire. Comme le document principal sera le même pour tous les destinataires, il peut utiliser toutes les facilités offertes par les systèmes de courrier électroniques pour éviter la transmission de multiples copies de documents identiques à des destinataires différents (ce point est examiné dans le chapitre concernant le courrier électronique). Les clefs secrètes encryptées devront, elles, être envoyées à chaque destinataire individuellement (puisque le résultat de l'encryption avec les clefs publiques fournies par chaque destinataire sera différent pour chaque destinataire) mais comme elles ne représentent qu'une faible quantité d'information, cela ne posera pas de problème pratique.

88

Dans les mécanismes de signature décrit ci-dessus, l'auteur quand il signe, doit être capable de fournir au programme de signature (basé par exemple sur le RSA) la clef secrète de l'algorithme à clef publique. Il en va de même du destinataire qui reçoit un document encrypté qui doit être capable de produire la clef secrète de l'algorithme à clef publique (RSA) qui protège la clef secrète de l'algorithme à clef secrète (DES) utilisée pour protéger la transmission ou le stockage du document. Le problème est que ces clefs sont assez longues et ne peuvent pas être 'choisies' par l'utilisateur. Il n'est donc pas possible pour lui de les mémoriser. Et même s'il mémorise sa clef (ou l'inscrit sur un bout de papier, ce qui n'est pas très sûr), il n'est pas rationnel de lui demander d'entrer une longue suite de nombres lorsqu'il veut signer ou lire un document. Il faut donc un système qui soit capable de stocker ces clefs.

On peut songer à les inscrire sur une disquette ou une carte magnétique. Il faut alors que le propriétaire de la carte veille à ce qu'elle soit toujours dans un lieu protégé de façon à ce que personne d'autre ne puisse l'utiliser et que personne n'en fasse des copies. Une autre solution est de placer ces clefs dans un coffre fort électronique dont seul le propriétaire ait la clef. Un tel système est réalisé par une carte à puce qui contient un circuit électronique avec une mémoire permanente et un petit processeur capable d'exécuter des programmes simples. La carte à puce peut être raccordée à un lecteur qui est capable de lui demander ou de lui transmettre des informations. Il est ainsi possible de programmer la carte à puce pour que, sur présentation d'un code choisi par l'utilisateur (un nombre de 4 ou 5 chiffres), elle fournisse son ou ses clefs secrètes.

Il est même possible de placer les algorithmes à clef publique et à clef secrète sur la carte. Les clefs ne sortent alors jamais de la carte (en tout cas sous une forme non encryptée) et il est impossible d'usurper l'identité de l'auteur. Bien entendu, la carte est programmée pour qu'un certain nombre de tentatives infructueuses d'accès utilisant des codes invalides la bloque définitivement.

1.25. Les possibilités du document électronique

Le document papier peut être transmis par courrier et être archivé. Ces opérations se font par transmission physique du document et par stockage d'une copie physique. La transmission d'un document est une opération coûteuse en ressource: il faut d'abord copier le document et ensuite le transporter. Par contre, dès qu'une personne possède un document, elle a aussitôt accès à son contenu (pour autant qu'elle connaisse la langue dans laquelle il est écrit).

Le document électronique est tout à fait différent:

Il peut être copié très facilement. En fait, la lecture d'un document à l'écran implique très souvent la copie d'une partie du document d'un disque vers une mémoire volatile, puis ensuite une copie sous une forme appauvrie d'une partie de la mémoire sur le médium d'affichage.

89

Chapitre 5: Le document dans l'espace et dans le temps

Il peut être transmis à grande distance à très grande vitesse et à très faible coût. La transmission a surtout un délai très faible. Le débit, lui, peut être assez lent, selon la vitesse des lignes de télécommunication. C'est cette propriété qui permet au WEB de fonctionner.

Par contre, la possession d'un document n'en garanti pas forcément l'accès. Il faut au minimum posséder l'afficheur nécessaire et, dans le cas d'un document encrypté, la clef d'accès.

Aussi, dans le monde électronique, les notions de stockage, d'accès et de mise à disposition prennent ils un sens assez différents:

Le stockage d'un document ne doit pas être organisé en fonction des droits d'accès. Un document peut être stocké en une seule copie, même s'il doit être partagé par plusieurs personnes éloignées physiquement les unes des autres et qui doivent pouvoir y avoir accès à tout moment. Le document papier impose lui toujours la copie pour être accessible à tout moment par des personnes qui ne sont pas localisées physiquement à des endroits proches.

L'accès à un document peut être géré de façon complètement découplée de son stockage. Le propriétaire du stockage d'un document ne maîtrise pas nécessairement le contrôle de ses droits d'accès. Ceux-ci peuvent être contrôlés par le logiciel d'archivage sous la responsabilité des auteurs des documents. Les techniques d'encryption et la gestion des clefs publiques permettent d'assurer ce contrôle même pour des documents dont le stockage n'est pas géré par l'auteur.

L'organisation logique du stockage en dossier peut être totalement découplée de l'organisation physique. L'organisation logique consiste en la création d'une arborescence de dossier qui peut être définie par une communauté plus ou moins locale d'utilisateur (à la limite, chaque utilisateur peut avoir son classement). Cela n'a aucun rapport avec l'organisation du stockage physique.

Le courrier électronique a deux fonctions logiques. D'une part, il signale qu'un document est mis à disposition pour accès en lecture par le destinataire. D'autre part, et simultanément, il confère le droit d'accès en lecture à ce destinataire.

Aussi un mécanisme d'archivage et de courrier électronique peut il copier les techniques utilisées pour le document papier. C'est souvent ainsi que sont construites les architectures bureautiques. Mais ce n'est pas la seule possibilité.

On peut imaginer qu'une organisation de taille importante possède un service de stockage de document. Un tel service a pour but de permettre la mise à disposition à tout moment de l'ensemble des documents pour toute personne ayant le droit d'accès, quel que soit l'endroit où cette personne se trouve.

Un tel service de stockage est donc construit sur un ensemble de machines, appelées serveurs, connectées entre elles par des réseaux. Chaque machine peut stocker des documents. Les types de stockage supportés varient de machine à machine. La plupart des machines possèdent des disques durs conventionnels mais d'autres possèdent des systèmes d'écriture sur disques inaltérables une fois écrits (CD-R ou WORM (Write Once, Read Many).

90

A travers le réseau, ces serveurs sont capables de s'échanger des informations sur la localisation de documents recherchés (service de répertoire). Ils sont aussi capables de gérer des multiples copies d'un même document. Ces multiples copies sont générées en fonction de l'analyse de la demande pour un document donné, de ses caractéristique propres et de la stabilité de celui-ci. Un document très stable, long et fort demandé par des utilisateurs dispersés géographiquement sera reproduit en plusieurs exemplaires afin d'être fourni à la demande avec un délai minimum et au moins coût. Un document qui est fréquemment modifié, est très court ou n'intéresse qu'un petit nombre de personnes géographiquement proches n'aura qu'une seule copie dans le système. Lorsqu'un modification est apportée à un document, ce réseau de serveurs de documents propagera la version modifiée pour qu'elle remplace l'ancienne version sur toutes les copies.

Un autre système indépendant du système de stockage peut contrôler les droits d'accès. Ce système doit former une couche qui entoure logiquement le système de stockage. Il doit accueillir toute demande d'accès, la valider par rapport à des listes de contrôles d'accès et, si elle est validée, la transmettre au système de stockage. Les documents les plus sensibles peuvent être encryptés dans le système de stockage. La gestion des clefs peut être faite par le système de gestion des droits d'accès, sous le contrôle des propriétaires des documents.

Chaque utilisateur ou une communauté d'utilisateur a le droit de construire son système de classement de ses documents. Des droits d'accès liés à chaque "dossier" du système de classement permettent de modifier les droits d'accès à un document en fonction de son classement et de l'accès de différents utilisateurs à chaque dossier.

Enfin, le courrier électronique permet juste de notifier à un utilisateur qu'un document est à sa disposition. La mise à disposition d'un document à l'utilisateur s'accompagne nécessairement de l'inclusion de cet utilisateur dans la liste des droits d'accès pour cette version du document.

On voit que dans cette approche, le rôle du courrier électronique est très différent de celui de "copieur de document avec transmission à distance". De la même façon, le rôle d'un système de stockage est très différent de celui de "stockage physique de copie de document selon une hiérarchie de classement". Certains produits bureautique s'inspirent directement de cette approche. Avant d'examiner certaines de leurs caractéristiques, les approches plus conventionnelles du courrier électroniques, de l'archivage et de la recherche documentaire et de la créations de répertoires sont d'abord examinées.

1.26. Le courrier électronique

Transmettre des documents parait en principe une activité assez simple. Il suffit de copier le document entre l'expéditeur et le destinataire. Pourtant, si on regarde de près la façon dont fonctionne le courrier papier classique pré-informatique, on s'aperçoit vite que la problématique du courrier électronique est relativement complexe.

91

Tout d'abord, le courrier papier ne se fait pas entre 2 personnes ; il se fait entre 2 boîtes aux lettres : une boîte aux lettres d'expédition et une boîte aux lettres de destination. La boîte aux lettres de destination est juste une façon de demander le service de transmission. On pourrait imaginer qu'au lieu de remettre le courrier à envoyer dans une boîte, on le remette directement à l'employé des postes. Le seul problème de cette approche (outre le manque d'intérêt pour un employé de poste d'avoir pour seul travail d'attendre la remise de lettres) est que s'il y a une 'heure de pointe', il va se former une file de personnes désireuse de poster des lettres. La boîte aux lettres de départ a donc juste un rôle de 'tampon' (buffer). Elle permet aux gens de demander une action indépendamment du rythme auquel le service est rendu (du moins pour autant que les boîtes aux lettres soient relevées à intervalles suffisants).

Les boîtes aux lettres de destination sont plus intéressantes. Tout d'abord, dans la vie réelle, elles n'appartiennent pas en général aux services postaux. L'exception est les 'boîtes postales' que la poste met à disposition de façon centrale pour les clients qui ne souhaitent pas que l'on connaissent leur adresse. Le service de boîtes postales est aussi fort utilisé dans certains pays où l'accès aux habitations est difficile, où la confiance placée dans les facteurs n'est pas grande ou où, tout simplement, l'état n'est pas en mesure de financer un service de remise à domicile. Très proche dans son concept est le service de 'Poste restante' (qui porte ce nom indépendamment de la langue du pays) qui permet d'adresser le courrier dans une boîte aux lettres 'commune' où le courrier est trié selon la première lettre du nom de famille.

Mais, en général, une boîte aux lettres est un endroit d'accès public en remise où les services postaux (ou n'importe qui d'autre) peut déposer n'importe quel document mais où seul le propriétaire de la boîte aux lettres peut retirer l'information. En terme informatique, une boîte aux lettres de destination est un endroit où tout le monde peut écrire de l'information mais où seul le propriétaire (ou le locataire) de la boîte peut lire l'information. Ce système de boîte aux lettres est là essentiellement pour accélérer la distribution du courrier mais surtout parce qu'il permet la remise du courrier même en l'absence du destinataire.

Le caractère public de la boîte aux lettres pose des problèmes. Sans aller jusqu'aux colis piégés, la boîte aux lettres pose le problème du contrôle de ce qui est déposé. Contrôle sur le type d'information (publicité, 'toute boîte') et contrôle sur le volume (saturation par de gros volumes d'information peu intéressante).

Un autre aspect intéressant du courrier papier est la notion d'enveloppe. L'enveloppe a 2 objectifs. D'une part, elle sert à mettre en évidence l'adresse de destination ; mais surtout, comme décrit dans les chapitres précédents, elle protège le contenu en empêchant une lecture indiscrète qui ne laisserait pas de trace. Il est possible de se passer d'enveloppe lorsque l'information est publique.

92

L'adresse postale est aussi fort intéressante. Il s'agit d'une hiérarchie de pays. Chaque pays définit en fait un domaine d'organisation du tri du courrier. Ainsi, un courrier envoyé à St Denis de la Réunion, à St Pierre et Miquelon où à Tahiti, peut avoir comme nom de pays 'France'. L'adresse par pays ne définit donc pas en fonction d'une contiguïté géographique, mais bien en fonction d'une unité d'administration. Cette unité d'administration définit les unités d'administration de niveau le plus bas, celles-ci à leur tour définissant la façon d'adresser des unités de plus en plus basse jusqu'à atteindre l'utilisateur final. En général, en dessous du pays, on trouvera l'état (pour les états fédéraux) ou une autre subdivision facultative pour les états centralisés puis la commune ou la ville. Au sein de la ville l'adresse identifiera la boîte aux lettres du destinataire (son nom servant juste à vérifier l'information) et lui-même pourra définir un système d'adressage privé s'il le souhaite. Là aussi, l'adresse du destinataire identifie en fait une organisation responsable de la distribution ultérieure du courrier et des organisations importantes se feront connaître par une adresse officielle unique d'où le courrier sera trié vers des bâtiments différents, éventuellement localisés dans des endroits différents.

La langue à utiliser pour une adresse illustre bien les différentes responsabilités. Le nom du pays devrait être mentionné dans la langue du lieu de dépôt du courrier. Le nom de l'état, de la ville et le reste de l'adresse publique devront être libellés dans une des langues supportée par le pays de destination, selon les règles qu'il a édictées. En principe, la partie privée de l'adresse sera écrite dans la langue utilisée par l'organisation qui effectue une distribution interne du courrier. A noter aussi qu'un courrier interne à une organisation comportera uniquement la partie interne de l'adresse, un courrier interne à un pays ou un état ne devra pas mentionner ce pays ou cet état.

Enfin, le courrier papier offre plusieurs qualités de service comme par exemple le service 'recommandé' (avec ou sans accusé de réception) ou le service express (avec ou sans délai maximum de remise). A noter aussi ce service spécial de transmission des imprimés qui sont transmis au sein d'un pays à des tarifs bon marchés et qui permettent à la poste d'ouvrir l'enveloppe afin de vérifier qu'il s'agit bien d'un imprimé. Clairement, ce n'est pas dans le fond le caractère 'manuscrit' ou 'imprimé' qui compte vraiment mais le fait qu'il est nécessaire d'avoir un tarif avantageux pour les envois souvent assez volumineux mais dont le délai de remise n'est pas critique.

Le courrier électronique doit résoudre les mêmes types de problèmes que le courrier papier. Il doit aussi supporter des problèmes spécifiquement informatiques résultant par exemple de la nécessité d'avoir un outil pour effectuer la lecture des documents.

Initialement, chaque entreprise n'avait qu'un seul ordinateur servant une multitude de terminaux. Très tôt, un service de messagerie électronique a été disponible. Ce service permettait d'éditer des messages simples, et de les déposer dans une zone de stockage accessible uniquement au moyen de programmes spécifiques. Ces zones de stockage n'appartenaient pas au système de fichier accessible normalement, ce qui permettait le caractère d'écriture publique, mais de lecture par un seul. Le caractère homogène de l'environnement (une seule machine, un seul programme de création de messages) le rendait assez simple à gérer. A noter que dès cette époque est apparue la nécessité de disposer d'un administrateur de courrier électronique chargé d'allouer les boîtes aux lettres, et de veiller à ce qu'elles soient périodiquement vidées. Dans ce modèle en effet, les boîtes aux lettres électroniques sont la propriété du service postal et non la propriété de l'utilisateur.

93

Dès qu'une entreprise a pu disposer de 2 ou plusieurs ordinateurs et surtout dès qu'elle a envisagé d'envoyer du courrier électronique à des entreprises qui n'étaient plus dans son domaine d'administration, il a fallu mettre en place un courrier électronique distribué. Dans ce type de courrier, les boîtes aux lettres sont localisées sur des machines différentes qui seront en principe disponibles 24h/24. Ces machines serviront souvent à la fois pour contenir les boîtes aux lettres d'expédition et les boîtes aux lettres de destination. Ces machines seront interconnectées entre elles ou avec des machines relais. Chacune de ces machines est appelée un MTA (Message Transfer Agent) en langage de la normalisation de l'ITU (ex-CCITT) ou de l'ISO.

Les MTA peuvent appartenir à des domaines d'administration différents. Si, au sein d'un domaine d'administration, il est possible de choisir de façon arbitraire la façon de communiquer (la norme de communication), pour franchir les domaines d'administration, il est nécessaire de définir une norme commune de communication. C'est le but de la norme X400 (pour le monde régit par l'ITU) et de la norme SMTP pour le monde INTERNET. Outre une norme de communication, il est aussi nécessaire de définir une structure d'adresse et au minimum les domaines d'administration de niveau supérieur.

Ainsi, le monde ISO a-t-il défini une structure d'adresse et les domaines d'administration de niveau supérieur qui sont les pays identifiés par un code. Le monde INTERNET effectue son adressage en fonction des grands 'sujet' puis des organisations qui gèrent un 'morceau' de l'INTERNET de façon à arriver au niveau de la machine supportant la boîte aux lettres du destinataire. Il existe aussi une organisation par pays.

Un message sera donc soumis par son expéditeur à un MTA en charge de son expédition. Le format du message pourra ne pas être interprétable par le MTA, mais en général, on associera au message un indicateur de format défini de façon publique de façon à ce que le destinataire sache comment interpréter le format reçu. Certains MTA peuvent aussi offrir un service de conversion, mais, vu les risques de dégradation de l'information que toute conversion implique, ce service devra explicitement avoir été choisi par l'expéditeur pour être activé.

Arrivé au MTA, le message sera examiné et selon son adresse, le MTA, soit prendra en charge sa remise au destinataire s'il est connecté au même MTA, soit le transmettra à un MTA particulier si le destinataire appartient au même domaine d'administration, soit le remettra à un MTA de sortie de domaine si le destinataire appartient à un domaine d'administration différent. Dans ce dernier cas, le MTA de sortie de domaine sera en contact avec un ou plusieurs MTA de sortie de domaine pour d'autres domaines d'administration. Selon l'adresse, il transmettra le message à un de ses homologues. En général, s'il ne peut pas déterminer un correspondant particulier à qui envoyer le message, il l'enverra à un MTA qui correspond à un domaine d'administration de niveau supérieur. Celui-ci, en examinant l'adresse fera circuler le message soit vers un MTA de son domaine, soit vers un MTA de niveau encore supérieur. Si le message est adressé vers un MTA de son domaine, à la réception, celui-ci déterminera parmi les MTA qui sont ses correspondants dans des domaines de niveaux inférieurs celui qui est capable de poursuivre l'acheminement du courrier vers le bas et la progression du message continuera jusqu'à atteindre la boîte aux lettres de destination.

94

On peut se demander, pourquoi on a inventé un tel système à relais pour acheminer du courrier électronique alors qu'il serait possible de créer une liaison directe temporaire entre le MTA d'origine et de destination (analogue à une liaison téléphonique) de l'utiliser pour transmettre le document et de la fermer dès que la transmission est terminée. Ceci est d'autant plus vrai que d'autres services fonctionnent selon ce principe (tel le WWW sur INTERNET) ou le FAX. L'avantage de ce mode de transmission, outre sa rapidité, est la possibilité de savoir tout de suite si le document est bien arrivé dans la boîte aux lettres du destinataire ou au contraire si un problème est survenu. Bien qu'il n'est pas certain qu'à l'avenir le mode d'échange direct similaire à la transmission 'FAX', 'TELEX' ou 'TELETEX' ne va pas connaître un renouveau d'intérêt à cause précisément du caractère 'synchrone' de la transmission qui permet à l'expéditeur de savoir 'en temps réel' si son message est bien arrivé, 4 avantages ont contribué au développement du système de courrier électronique par relais :

La possibilité d'envoyer à de multiples destinataires en évitant la transmission répétitive entre l'expéditeur et chaque destinataire. C'est un problème bien connu des opérateurs FAX qui doivent envoyer leur FAX autant de fois qu'il n'existe de destinataires même si ceux-ci sont physiquement proches les uns des autres et éloignés de l'expéditeur. Ainsi, dans le cas de l'envoi d'un expéditeur en Europe à 3 destinataires aux Etats-Unis, le message ne traversera l'Atlantique qu'une seule fois dans le cas d'un système à relais (et le MTA outre-Atlantique copiera le message chez les 3 destinataires).

L'hétérogénéité des réseaux entre domaines a rendu pendant longtemps illusoire l'adoption d'un seul protocole qui serait compris par tous les couples émetteur-récepteur. Il était plus pragmatique de laisser chaque domaine choisir chaque protocole de transmission et de ne prévoir une standardisation qu'à la frontière de chaque domaine. La situation est cependant en train de changer et les protocoles INTERNET (SMTP, MIME) sont notamment maintenant largement répandus.

Les systèmes à relais étant asynchrones permettent plus de souplesse dans la gestion du trafic. Possibilité de transmettre le courrier à faible priorité sur les lignes 'chères' pendant les heures creuses, possibilité de re-router le trafic en fonction de contraintes d'opération ou de sécurité, indépendance vis à vis des décalages horaires, possibilité de stocker de façon temporaire des messages en cas de non disponibilité d'un MTA etc...

Les systèmes à relais permettent à des opérateurs publics ou privés de définir un service de transmission, service à valeur ajoutée et donc plus rentable qu'un simple service de mise à disposition d'une infrastructure de télécommunication de base.

Tous ces avantages (dont beaucoup tendent à s'atténuer au fur et à mesure de la disponibilité de lignes de communication à haute vitesse et à bas prix) compensent difficilement le principal inconvénient des systèmes à relais : le fait que le délai de réception maximal est plus difficile à garantir, et que le temps nécessaire pour se rendre compte qu'un message a été perdu par le réseau est nettement plus long.

95

Pour communiquer avec un MTA, un utilisateur utilisera un protocole d'accès. Ce pourra être un protocole similaire à celui utilisé entre MTA ou ce pourra être un protocole plus simple asymétrique de type 'client'-'serveur' où le matériel de l'utilisateur (en général son PC) demande un service au MTA (par exemple de prendre en charge un document pour envoi ou de lui fournir tous les documents reçus dans sa boîte aux lettres).

Outre les problèmes de conversion de format et de signature électronique dont il a déjà été question, le courrier électronique pose en général les problèmes suivants :

Des problèmes de définition des services supportés par différents domaines interconnectés. Ainsi un courrier électronique d'un certain domaine peut-il supporter un acquit de réception alors qu'un autre domaine auquel il est interconnecté supporte plutôt un acquit de lecture. Comment interconnecter ces 2 réseaux et définir le service rendu lorsqu'un message passe d'un domaine à un autre ?

Des problèmes de répertoire. Ce problème est décrit dans le chapitre suivant.

Des problèmes d'utilisation des outils de visualisation. Un courrier électronique peut supporter des documents de description très riche. Ceux-ci, pour leur affichage demanderont l'utilisation d'un 'afficheur' (viewer) qui sera lent à se charger et à charger le document. La situation est encore plus grave si les documents sont gros et doivent être imprimés. La lenteur du processus pénalise le destinataire qui n'a pour se défendre que la seule possibilité de jeter le document. Il est donc important de bien définir le format des documents, la taille maximale de ceux-ci et de fournir des outils qui permettent une visualisation rapide. L'affichage d'un document à l'écran ne doit pas prendre plus de 2 secondes pour être acceptable à un utilisateur et il est donc plus judicieux d'utiliser un afficheur spécialiser qu'un outil tel que le traitement de texte qui a servi à créer le document. En particulier, il faut éviter que le courrier électronique ne transforme le travail fastidieux de photocopie chez l'expéditeur en travail fastidieux d'impression chez les destinataires... La photocopie chez l'expéditeur ayant au moins l'avantage de pénaliser celui-ci.

Des problèmes de calcul des capacités de stockage et de communication. Le courrier électronique distribué tend à multiplier les copies et donc les coûts de stockage. L'idéal serait de coupler 'stockage du document' et 'courrier électronique' comme décrit dans le chapitre précédent ou dans le chapitre relatif aux outils de travail en groupe. De plus, il est possible à un utilisateur malicieux (ou suite à une erreur) d'envoyer un gros volume de courrier inutile (junk mail) dans une boîte aux lettres et par ce moyen, de saturer les capacités de stockage des machines. Pour cette raison, la plupart des systèmes de courrier électronique limitent la taille du courrier à une taille maximale (2 mégabytes par exemple) par document et ont des mécanismes qui ne permettent la réception de nouveau courrier que si l'espace disque est disponible pour la boîte aux lettres.

96

Le courrier électronique transporte des informations intéressantes telles que le nom de l'expéditeur et du destinataire, la date et l'heure d'envoi et celle de réception ou de lecture. Ces informations devraient pouvoir être récupérées pour alimenter les outils d'enregistrement de courrier ou les serveurs d'archivage. Malheureusement l'absence d'interface programmation (API) ou le peu de fonctionnalités offertes par les interfaces standards qui existent rend souvent difficile ce genre d'intégration et plus généralement toute interaction entre le courrier électronique et un système d'information.

1.27. Répertoire

Le courrier électronique demande une gestion des adresses des destinataires. Comme dans le courrier non électronique, il est souhaitable qu'il existe un mécanisme de répertoire permettant de passer d'un nom c-à-d de l'identification d'un objet ou d'une personne à l'adresse de cet objet ou cette personne c-à-d à un chemin d'accès. Ce problème se pose bien entendu dans l'envoi de courrier. Mais il se pose aussi dans d'autres domaines. Ainsi, dans le WWW, les documents liés entre eux par des hyperliens sont identifiés pour l'instant par une adresse c-à-d un chemin d'accès ; il serait souhaitable qu'à l'avenir ils soient identifiés par un nom (par exemple un numéro ISBN) ; cela permettrait de les retrouver indépendamment de leur position physique ; ils pourraient être dupliqués sur plusieurs serveurs ou être changés de localisation sans qu'il n'y ait de problèmes d'accès.

Disposer d'outil de conversion nom-adresse est encore plus important dans le domaine de l'infrastructure informatique. Ainsi, de plus en plus, les logiciels sont décomposés en composants, chaque composant étant capable de rendre un service. Ces composants sont placés sur le réseau et sont accessibles via des protocoles de communication de type 'client-serveur'. Dans un tel environnement, il devient difficile pour chaque composant de connaître l'adresse de chacun des autres composants. Il faut un mécanisme de répertoire permettant à chaque composant, au départ du nom du service qu'il cherche à atteindre, de trouver l'endroit le plus accessible où le service est disponible.

Dans un certain sens, un nom et une adresse ont la même structure. Il s'agit d'une décomposition hiérarchique selon des organisations qui sont habilitées à définir des portions du nom. Dans la vie courante, les parents ont le droit de définir le prénom de leurs enfants. Ce prénom est une sous-hiérarchie du nom de famille. Le nom de famille lui-même est identifié par rapport à un pays ou une ville (les Bertrand de Bruxelles). Et quand les noms sont associés à des objets (comme les marchandises identifiées par des codes barres dans les supermarchés), il s'agit aussi d'une hiérarchie souvent constituée selon une définition plus ou moins arbitraire de 'types' et de 'sous-types' ou de 'lieu d'origine' des objets.

Une adresse sera aussi une hiérarchie mais cette hiérarchie reflétera un chemin d'accès dans lequel chaque organisation en charge d'un niveau fournira

Un chemin pour accéder aux niveaux inférieurs dont l'identification dépend de sa juridiction

Un chemin pour accéder au niveau supérieur

97

En pratique, il pourra aussi exister des schémas d'implémentation du routage plus efficace où par exemple une organisation d'un niveau est aussi capable d'adresser directement certaines organisations frère dans l'arborescence des adresses.

Il faut noter que "nom" et "adresse" sont des concepts frère. Ainsi, ce qui est une adresse à un niveau peut être considéré comme une nom au niveau inférieur. Ainsi un courrier INTERNET adressé à Philippe Bertrand, de Bruxelles devra être traduit dans une adresse de type [email protected]. Cette adresse est elle-même un nom pour le niveau inférieur, qui devra traduire ce "nom" dans une adresse internet du serveur de boîte aux lettres du type 128.132.45.14. Cette adresse peut être une adresse physique, mais dans le cas d'un réseau local, cette adresse est elle-même un nom qui doit être traduit dans une adresse Ethernet.

Le problème de conversion nom-adresse se résume donc à convertir une identification hiérarchique en une autre identification hiérarchique. Ce processus de conversion est similaire à celui fourni par les pages blanches des annuaires téléphoniques. Au départ de la hiérarchie 'pays'-'région'-'nom', on peut obtenir la hiérarchie 'pays'-'ville'-'adresse postale (rue, numéro, numéro d'appartement').

A coté de cette conversion 'page blanche' (white pages), il existe aussi des services de répertoires 'pages jaunes' (yellow pages). Il s'agit simplement de retrouver le nom et l'adresse d'un ou plusieurs objets ou personnes au départ d'attributs attachés à l'objet ou à la personne. En un sens les pages jaunes ne diffèrent pas fondamentalement des pages blanches. Au départ d'une hiérarchie de 'thèmes' ou d'attributs, il s'agit de retrouver l'adresse d'un ou plusieurs objet. Dans les pages blanches, cependant, comme on part d'un nom supposé unique, on obtient une ou plusieurs adresse qui correspondent au même objet. Dans le cas de pages jaunes, à l'issue du processus de conversion, on obtiendra plutôt un ou plusieurs noms qui pourront être associées chacun à une ou plusieurs adresses.

Qu'il soit de pages blanches ou de pages jaunes, un répertoire est essentiellement une base de données. Dans le cas des pages blanches, au départ d'un nom cette base de donnée fournira les adresses. Cette base de données doit nécessairement être répartie pour obéir à 2 contraintes :

Comme le nombre d'objets est potentiellement grand, il doit être nécessaire de permettre le partitionnement selon une hiérarchie. Idéalement, cette hiérarchie devrait être la hiérarchie de nom. En pratique, la hiérarchie est une hiérarchie d'adresse, chaque entité responsable d'un domaine d'adresse fournissant un répertoire des noms correspondant à ses adresses. Pour utiliser un répertoire nom-adresse, il faut donc connaître certaines informations sur l'adresse recherchées…

D'autre part, comme les utilisateurs des répertoires sont nombreux et dispersés géographiquement, il est nécessaire que les répertoires puissent être au moins partiellement dupliqués de façon à éviter un engorgement des accès. Cela est d'autant plus nécessaire que des répertoires tels que des répertoires de services, sont indispensables pour le fonctionnement des services et que leur non-disponibilité peut conduire à un blocage de l'accès au service. Ces répertoires distribués doivent être synchronisés entre eux.

98

mailto:[email protected]

Une telle architecture de base de données distribuées ne serait pas faisable avec les techniques actuelles si la synchronisation des répertoires devait être faite en temps réel. Heureusement, dans le cadre de répertoires, une désynchronisation temporaire est admissible.

Un système de répertoire électronique est donc un ensemble de bases de données qui contiennent des équivalences nom-adresse. Chaque base de donnée peut interagir avec les autres bases de données soit pour demander une réplication des données, soit pour transmettre une demande qu'elle ne peut satisfaire à une autre base de donnée (chaînage). La réplication a pour but essentiel de résoudre le problème de la répartition géographique des serveurs d'adresse en créant des bases redondantes. Le chaînage suit en général la hiérarchie de la structuration en nom et permet à un répertoire de résoudre une demande d'adresse en envoyant la requête à un autre noeud dépendant de l'organisation qui a défini la structure des noms. Techniquement, on a donc deux types de processus d'échange entre répertoires: un basé sur un processus de diffusion et un basé sur des requêtes individuelles. La répartition des serveurs de noms doit permettre une optimisation des temps de réponse et de la charge réseau en fonction des noms utilisés les plus fréquemment et du nombre de demandes.

Dans les environnements locaux, les protocoles utilisés pour régler les problèmes de diffusion ou de requête sont souvent basés sur les propriétés de 'diffusion' (broadcast) du medium. C'est le cas notamment des protocoles NIS (ex-yellow pages) de SUN. Un répertoire peut, grâce à ces mécanismes, être partiellement dupliqué sur un ensemble de noeuds interconnectés. Une demande de résolution de nom peut être adressée en parallèle à un grand nombre de serveur de noms.

Dans le domaine des réseaux publics, de telles diffusions massives ne sont évidemment pas possibles. Des fichiers d'adresses peuvent être échangés périodiquement entre les différents noeuds du réseau mais l'échange doit veiller à ne pas saturer des capacités d'échange fort limitées. Par contre, il est important d'avoir un nombre suffisant de serveurs de répertoires pour éviter les problèmes de saturation que connaissent des réseaux comme INTERNET aux heures de pointe.

Il existe une norme appelée X500 qui définit d'une part la stucturation des noms et adresse et d'autre part définit les protocoles

Entre égaux (peer-to-peer) utilisés par l'ensemble des répertoires pour s'échanger des diffusion d'adresses ou se transmettre des requêtes.

Client-serveur pour permettre à un utilisateur de demander à son serveur de répertoire le plus accessible de lui résoudre une conversion nom-adresse (seul ou en collaboration avec d'autres serveurs de répertoires).

Contrairement à la norme X400, cette norme n'est pas très implémentée en pratique: la plupart des systèmes de courrier électroniques ont leur propres systèmes de répertoire. La structure des répertoires de chaque système lui est propre et ce caractère spécifique rend difficile l'utilisation de répertoires à travers des réseaux interconnectés. Le monde INTERNET est lui-même en train d'essayer de résoudre son problème de répertoire via un protocole appelé LDAP (Light Directory Access Protocol).

99

1.28. Les bases de données documentaires

Les bases de données documentaires sont des bases stockant un grand volume de texte et offrant des facilités particulièrement puissantes d'extraction. Dans ces bases, on découpe le texte en unités documentaires. Une unité documentaire sera l'élément de base de l'accès. L'unité documentaire pourra être le paragraphe, la page physique, le document (un article d'une revue). En général une unité documentaire fera quelques pages au maximum.

A chaque unité documentaire, on associera 3 types d'attributs qui permettront la recherche ultérieure de l'unité documentaire :

Des propriétés de l'unité documentaire tels que l'auteur, la date de création, la date de dernière modification, une série de mots clef voire l'ensemble des mots importants (significatifs) de l'unité documentaire.

Une structuration hiérarchique du texte en chapitre, sous-chapitre, paragraphe, chacune de ces unités hiérarchiques pouvant avoir un ensemble de propriétés.

Des liaisons entre des points à l'intérieur du texte et d'autres documents ou d'autres points à l'intérieur du même document.

Les propriétés de l'unité documentaire permettent une recherche par critères. On distingue habituellement 3 types de propriétés :

Les attributs analytiques: il s'agit de toutes les propriétés qui permettent d'enrichir sémantiquement le document. En général, ces propriétés sont identifiées par des documentalistes et attachées au texte. Parmi ces propriétés, la liste des mots clefs est la plus importante. Cette liste des mots clef peut être extraite d'un vocabulaire ouvert (chaque documentaliste peut ajouter ses propres mots clef) ou fermé (chaque documentaliste doit extraire les mots clef d'une liste donnée. Outre les mots clef, le documentaliste fournira aussi un petit résumé synthétique de l'unité documentaire. Ce résumé sera utilisé lors de la recherche pour valider à priori le caractère pertinent du document. Un documentaliste peut aussi ajouter un certain nombre de dates extraites du texte ou toutes autres informations difficiles à extraire automatiquement du texte.

Les attributs automatiques: il s'agit de propriétés dont la valeur est fournie automatiquement par le système. Ainsi, on peut avoir la date d'entrée du document dans la base, la date de dernière révision, dans certain cas, l'identification de l'auteur etc...

100

L'indexation 'full text'. Il s'agit essentiellement de stocker dans la base la liste de tous les mots du texte. A nouveau, on distingue l'indexation 'full text' ouverte où tous les mots du texte sont enregistrés, à l'exception éventuelles de certains mots qui appartiennent à une liste de mots vides (une liste de mots vides est une liste de pronoms, d'articles, des verbes comme 'avoir' ou 'être' qui ne sont pas discriminant pour effectuer une recherche) et l'indexation 'full text' fermée où seuls les mots qui appartiennent à une liste définie à priori sont enregistrés. Il existe beaucoup de variantes de l'indexation 'full text'. Ainsi un système peut garder la trace de l'appartenance des mots à certains paragraphes ou garder une trace de la position des mots dans le texte. Il est alors possible de faire de la recherche contextuelle (trouver les mots qui appartiennent à un même paragraphe) ou de la recherche positionnelle (trouver les ensembles de mots adjacents). En général, les index utilisés pour faire la recherche seront une version appauvrie des mots (par exemple, une version majuscule et non accentuée des mots). Avant d'effectuer une recherche, les critères seront convertis dans ce format 'pauvre' de l'index.

La recherche par critère, pose habituellement les problèmes de 'bruit' et de 'silence'. On dit qu'une recherche contient beaucoup de bruit, si la recherche extrait des documents qui ne sont pas pertinent pour le sujet recherché. Ce cas provient quand les critères sont trop généraux, sont mal choisis ou ne sont pas assez nombreux. Une recherche conduit à du silence lorsque la recherche n'identifie pas des documents pertinents. En général c'est que trop de critères sont présents où que la base de donnée documentaire est trop simple et en particulier ne contient pas de thésaurus (ce concept est expliqué plus loin). Le problème du 'silence' est en général considéré comme beaucoup plus grave que celui du 'bruit'.

Une recherche par critère sur base des propriétés commence en général par une formulation assez générale de la recherche. Le résultat de la recherche n'est pas à ce stade les unités documentaires elles-mêmes mais simplement le nombre d'unités satisfaisant les critères. Des critères de recherches supplémentaires sont, le cas échéant, ajoutés de façon à arriver à un nombre de documents acceptable (une cinquantaine maximum). Les résumés du texte sont alors affichés (où les portions de texte qui entourent les mots identifiés ou encore les titres des unités documentaires sélectionnées) et l'utilisateur peut sélectionner et ramener les documents qui l'intéressent vraiment.

Les liaisons directes entre documents permettent la navigation d'un texte à l'autre. Elles sont en général utilisées après que la recherche par critère ait fourni un ensemble de documents pertinents. Le problème des liaisons directes est d'assurer leur maintenance. Lorsqu'il document est détruit, il est souvent impossible de connaître tous les documents qui pointent vers le document détruit et dont les liens doivent être détruits. Comme les liens sont souvent des adresses et non des noms, le simple déplacement de la localisation d'un document suffit souvent à détruire le lien.

La structuration hiérarchique du texte permet les 2 types de recherche.

On peut associer certaines propriétés à certains niveaux dans la hiérarchie (par exemple 'auteur' sera associé à chaque document, alors que des mots-clef seront associés à chaque chapitre) et permettre ainsi des recherches définies par des critères appartenant à plusieurs niveaux.

101

Il est aussi possible de faire un parcours hiérarchique du texte en suivant l'ordre des chapitres, sous-chapitres etc... et cette technique s'apparente plus à une navigation.

La navigation sur le WEB utilise ces techniques. Un utilisateur recherche souvent un ensemble de documents via un moteur de recherche. Ce moteur de recherche produit dynamiquement un document possédant des liaisons directes avec les documents qui satisfont aux critères de recherche. L'utilisateur peut alors naviguer à partir de ce document dynamique vers un réseau de documents liés entre eux. Cette technique de construction dynamique de document contenant des liens vers d'autres documents est de plus en plus utilisées notamment lorsque l'on doit lier des informations structurées avec des documents non structurés. Ainsi un système de comptabilité permettra de rechercher et trouver les informations sur les factures et les paiements (informations structurées) et fournira lors d'une recherche un lien vers les pièces comptables (document papier) préalablement digitalisées.

Le WEB a popularisé la notion de liaisons entre documents (hyper-liens). De nombreux sites tentent de construire des ensembles de documents en se basant uniquement sur les liens entre documents. Ces systèmes sont basés sur des documents "menu" organisés en hiérarchie. Construire un système à menu n'est pas facile et ne peut vraiment être fait avec succès que dans des domaines bien précis. Chaque niveau du menu sert en fait

A définir le type d'information sur lequel l'utilisateur pourra effectuer la suite de sa sélection.

A définir les valeurs possibles pour un type d'information (une propriété) de façon à restreindre l'ensemble des documents.

A partir du moment où il existe plusieurs types d'information permettant de sélectionner des ensembles de documents, il faudra effectuer toutes les combinaisons de toutes les valeurs possibles pour permettre à l'utilisateur de sélectionner les documents adéquats. Ainsi, si des documents comptables sont classés par type de document (contrat, facture, paiement, lettre de rappel) et par catégorie d'objet acheté, le système de menu devra permettre de combiner le choix du type de document avec le type d'objet auquel il se rapporte. Il n'est pas difficile de voir que de telles combinaisons donnent rapidement des systèmes ingérables et où l'utilisateur a vite l'impression d'être perdu. Ce problème est à l'origine de bien des difficultés de structuration de nombreux sites WEB. Une des façons de l'analyser est d'examiner à chaque niveau de la hiérarchie si la discrimination permet de choisir une propriété parmi les propriétés possibles ou une valeur parmi les valeurs possibles pour une propriétés possibles et ensuite de valider si la combinaisons des différentes propriétés utilisées pour construire la hiérarchie de menus ne donne pas lieu à une explosion des combinaisons possibles.

102

Les outils de recherche par propriété sont parfois complétés par des thesaurus qui reprennent des relations entre plusieurs termes. Parmi les 13 relations reconnues par une norme ISO, on peut noter la 'synonymie' qui permet de privilégier une formulation d'un terme de recherche par rapport aux autres possibles (par exemple 'automobile' pour 'auto', 'voiture' ou... en argot une 'tire') et la 'relation de groupe' permettant de hiérarchiser plusieurs termes (par exemple 'moyen de transport' qui comprendra 'automobile', 'chemin de fer' etc...). En permettant la création de semblables réseaux sémantiques, l'utilisation de thésaurus permet de rendre une recherche par critère beaucoup plus performante. La réalisation d'un thésaurus est cependant un travail important nécessitant plusieurs hommes-années et n'est pas à la portée de toutes les organisations.

Les bases documentaires ont 2 grandes applications: les bases 'en ligne' et les bases 'CD-ROM'.

Les bases CD-ROM sont très faciles à produire, contiennent une quantité raisonnable d'information (+/- 600 Moctets) et ne coûtent que quelques francs à la production. Elles ne nécessitent pas de systèmes de télécommunication difficiles souvent à obtenir avec le débit et la fiabilité adéquate. Pour l'entreprise, elles sont intéressantes parce qu'elles se traduisent par des coûts prévisibles en terme d'achat ou d'abonnement. Il est parfaitement économique de produire et de distribuer un CD-ROM tous les 15 jours. Ces bases offrent aussi beaucoup de souplesse en matière d'interface homme-machine, d'une part parce que la proximité entre la base et l'écran d'affichage permet des débits d'information important et d'autre part parce que le programme qui gère l'extraction de la base et l'affichage sur écran ou imprimante est associé au CD-ROM. Le CD-ROM est en quelque sorte un "document-objet" contenant à la fois les données et les programmes, ce qui permet à son créateur d'y inclure n'importe quelle technique d'interface techniquement réalisable.

Les bases en ligne sont importantes lorsque le contenu de l'information doit être très frais, lorsqu'il s'agit de diffuser de l'information qui n'est que rarement nécessaire à l'utilisateur ou encore lorsqu'il s'agit d'atteindre un public large mais mal défini (comme c'est le cas dans la diffusion de publicité). Le problème traditionnel des bases on-line, avant l'arrivée d'INTERNET était la difficulté d'accès via des lignes à faible vitesse, leur langage d'interrogation parfois vieillot et ésotérique, les possibles saturations du serveur et surtout l'imprévisibilité des coûts, fonction de la durée de la connexion et éventuellement du type d'information accédée. Seules certaines bases juridiques ou médicales contenant de l'information de grande valeur étaient accessibles en ligne et la combinaison qui semblait la plus prometteuse il y a quelques années était un mode de diffusion mixte basé sur une combinaison 'CD-ROM' et accès en ligne pour les informations les plus récentes.

L'arrivée d'INTERNET a bouleversé totalement le monde des bases de données en ligne en le faisant sortir de son marché de "niche". En effet INTERNET via le WEB (WWW World Wide Web) a créé

Un environnement standard permettant de construire des documents munis d'hyper-liens (c-à-d des liens entre documents) et des interfaces conviviales à des bases de donnée documentaires "classique" permettant la recherche sur propriété.

La possibilité de véhiculer n'importe quel type de contenu et en particulier de transporter des images, malgré des bandes passantes parfois assez faibles.

103

Un marché important pour les fabricants de "modem" qui a poussé ceux-ci à offrir des capacités de transmission de plus en plus rapides sur des lignes téléphoniques normales. De 1200 bits/seconde, fin des années 80, la vitesse de transmission normale sur lignes téléphoniques analogiques classiques est passée à 56.000 bits/seconde, rendant peu attractive des solutions basées sur des réseaux numériques à faible vitesse (ISDN à 2 x 64.000 bits/seconde).

Une solution au problème des coûts variables d'accès à l'information en fixant un tarif indépendant de la distance et de la durée et correspondant à la mise à disposition d'un débit maximum nominatif ou réel. De plus, la plupart des services d'accès à des documents ont préféré se faire financer par la publicité plutôt que par le paiement direct par l'utilisateur.

Les bases en ligne posent des problèmes difficiles de mise à jour.

Tout d'abord lors d'indexation par critères (permettant une recherche via les propriétés du document), le chargement de nouveaux index est une opération très gourmande en ressource et qui demande souvent que la base ne soit plus disponible aux utilisateurs pour effectuer des recherches pendant la période de chargement (à moins de disposer d'une "base image" utilisée pour l'accès pendant la mise à jour).

Ensuite, charger une base en ligne demande de charger un document, son index full text et son indexation analytique. Le chargement du document est une opération simple. L'indexation 'full text' peut demander l'arrêt de la base et l'indexation analytique doit se faire au rythme de la disponibilité des documentalistes.

Il est souvent aussi nécessaire d'effectuer une révision du texte à posteriori, ne serait ce que pour enlever de l'index 'full text' les mots erronés entrés du fait de fautes d'orthographe.

Aussi est il est en général nécessaire de disposer de systèmes informatisés de 'production' capable de gérer le processus de mise à jour de telles bases en ligne. Une autre tendance est de ne prévoir que l'indexation "full text" via des moteurs qui sont indépendants des documents et qui, de façon autonome, explorent en permanence l'ensemble des documents accessibles et mettent à jour des index contenant l'ensemble des mots du contenu ou seulement des titres de ces documents.

1.29. Les systèmes d'archivage

Les systèmes d'archivage complètent la chaîne bureautique. Lorsque les documents arrivent par courrier électronique, ils sont lus et ils doivent ensuite être archivés. L'archivage est similaire à un stockage dans une base de données documentaires. En général, ils stockent des informations structurées tel que le titre, l'auteur, la date de réception des documents, les co-destinataires et l'association à un ou plusieurs dossiers.

104

Dans une base d'archivage, il est important de pouvoir extraire un maximum d'information automatiquement. Alors qu'un système documentaire va stocker des documents qui vont être souvent consultés en lecture, qui sont très nombreux et qui doivent pouvoir être retrouvés avec des stratégies de recherche sophistiquées, les systèmes d'archivage de document doivent permettre d'archiver un document en quelques secondes. Il n'est en effet pas concevable qu'un document qui soit lu en quelques secondes et qu'il est nécessaire d'archiver pour garder une trace d'événements demande plus de quelques secondes pour son archivage. Et ce d'autant plus qu'un document a souvent de multiples destinataires et que chaque destinataire risque de faire ce même processus de classement.

Or le document lui-même possède une partie de l'information. En général, il possède un auteur, une date de création, un titre ou un sujet. Le problème est bien entendu que la représentation n'est pas assez riche que pour extraire automatiquement l'information. Aussi est il intéressant, au moins au sein d'une organisation, de définir un style standard obligatoire pour tous les document et permettant d'extraire automatiquement l'information nécessaire. Grâce à l'utilisation de ce style, qui définira des structures telles que la date de création du document, sa version, les destinataires principaux, les destinataires en copie, le titre ou le sujet et son auteur. Il sera alors possible via le langage de programmation lié traitement de texte qui a servi à créer le document d'extraire l'information et de l'injecter automatiquement dans le système d'archivage lors que le document est archivé.

Une autre source d'information est le courrier électronique lui-même. Il contient l'information sur l'expéditeur, les destinataires réels, un sujet, la date réelle d'expédition, la date de réception et la chaîne des réponses à un document reçu. Le système d'archivage devra donc extraire cette information du courrier électronique lors de l'archivage du document. Parfois, le système d'archivage sera lui-même une simple extension du système de courrier électronique.

L'association à un dossier se fera, elle, en créant tout d'abord une hiérarchie de dossiers ou de répertoires, constituant ainsi une nomenclature de classement et en glissant le document dans le dossier.

Un problème important que doit résoudre le système de stockage de l'information est de protéger l'accès au document. Les règles d'accès peuvent être très complexes selon que l'accès est en écriture ou en lecture, la sensibilité du document et les liens organisationnels entre les personnes.

Un des problèmes est de choisir le système dossier. Plusieurs systèmes sont possibles:

Le système de fichiers du système d'exploitation. Le problème de cette approche est que le système de fichiers ne permet pas de structurer l'information supplémentaire associée au document. La seule information additionnelle est le nom du fichier et des informations concernant le droit d'accès. Il est donc possible de définir des conventions de nommage, mais leur respect ne peut être assuré que pour un groupe très informel de personnes. A l'avenir, l'extension des fonctionnalités des systèmes de fichiers pourrait combler progressivement ces lacunes. Le principal avantage de cette approche est sa simplicité et sa possibilité de partage des documents entre membres d'un même groupe.

105

Le système de courrier électronique. L'avantage du système de courrier électronique est de permettre une intégration facile avec les informations que ce courrier électronique véhicule. Il est cependant rare que le courrier électronique possède lui aussi toutes les fonctionnalités voulues.

Un système spécialisé d'archivage. De tels systèmes offrent des fonctionnalités importantes en terme de sécurité et de possibilité de classement et d'indexation des documents. Ils sont cependant parfois difficiles à intégrer avec les autres systèmes censés leur fournir de l'information tels que le courrier électronique et le document lui-même. Ce problème n'existe cependant pas avec des outils intégrés pour lequel le courrier électronique n'est qu'un aspect de la gestion du stockage du document.

Un système spécialisé construit autour d'une base de donnée relationnelle. Il est maintenant possible de stocker des documents complets dans des enregistrements de bases de données relationnelles. Cette approche permet d'intégrer étroitement données structurées et données non structurées et de bénéficier des outils associés aux bases de données relationnelles. Cette approche est cependant souvent pénalisante en terme de performance.

On peut aussi indexer les documents que l'on veut stocker dans le serveur d'archivage sur base du contenu du document si ces documents sont dans des conditions permettant une indexation automatique (format orienté 'caractère', monolinguisme...). L'indexation peut être 'ouverte' ou 'fermée'. Une indexation selon une classification fermée dans une liste de mots-clef correspondra en fait à une proposition de dossier où chaque mot clef correspondra en fait à un dossier. Dans de nombreux cas cependant, les documents ne sont pas disponibles dans un format "caractère" parce que l'on ne dispose que d'une copie papier et que les documents ont dû être numérisés.

Un système de gestion de dossier sophistiqué doit faire plus qu'enregistrer l'information sur les documents reçus. Il doit aussi être capable, dans bien des cas, de gérer des échéances liées à des délais maxima de réponses. Ainsi dans des procédures formelles administratives, il existe souvent des délais de réponse. C'est le cas également pour des sociétés de service lorsque le délai de réponse à une demande est un élément important permettant de juger de la qualité du service. Lors de la réception d'un document, il doit donc être possible de définir une échéance pour sa réponse, de garder en mémoire à qui il a été attribué pour action et avec quel délai et d'enregistrer que l'action demandée par le document a effectivement été accomplie. A cet égard, un système d'archivage se rapproche d'un système de gestion du flux.

Le texte est lui-même doit pouvoir être stocké dans différents formats ; il y a souvent un format 'révisable' utilisé pour stocker les documents de travail et un format 'non révisable' souvent de type 'pixel' utilisé pour des archivages de longue durée. L'objectif de ce dernier format est d'avoir une durée de vie la plus longue possible. Il faut noter aussi qu'il est souvent intéressant pour des raisons légales de stocker des versions non révisables et non modifiables des documents. Ce genre de contraintes sont en effet celles que l'on souhaite dans des journaux comptables, des actes juridiques ou de plus généralement de toute information qu'il ne doit pas être possible de modifier 'après coup'. Les techniques de signature avec checksum permettent de garantir la non modification des documents stockés.

106

C'est aussi pour les mêmes raisons légales que les documents sont parfois stockés sur certains types de disques optiques. En effet certains types de disque optique sont de type WORM (Write Once Read Many). Une information stockée sur un disque WORM peut être écrite mais ensuite, elle ne peut pas être modifiée physiquement. La gestion de ces WORMs pose cependant elle-même ses propres problèmes. En effet s'il ne doit pas être possible d'effacer physiquement de l'information, il doit être possible de l'effacer logiquement. Un WORM contient donc un système complexe d'index permettant de savoir où se trouve réellement un document supposé avoir été modifié. Ce système d'index, situé sur le WORM doit lui-même est mis à jour à chaque addition ou modification/destruction 'logique' d'un document.

Un système d'archivage long terme vise à remplacer l'archivage longue durée dans des locaux spécialisés. Le problème principal de ce type d'archivage est de garantir qu'un format d'enregistrement et qu'un media d'enregistrement seront toujours lisibles dans 10 ou 30 ans. La question n'est pas triviale. Les media magnétique perdent leurs propriétés en 10 ans et doivent donc être réécrits passés cette date. Les disques optiques ont une longévité plus longue mais les formats propriétaires utilisés par les systèmes d'il y a quelques années font douter de la possibilité de trouver encore des lecteurs adéquats. Seul le CD-ROM semble être un media dont la pérennité semble satisfaisante. Son successeur pourrait être le DVD-ROM. En ce qui concerne le format lui-même, seul des formats très populaires, type TIFF, GIF ou JPEG semblent capables d'être encore lisible dans quelques dizaines d'années.

Les systèmes d'archivage sont souvent associés aux systèmes de numérisation. En effet, lorsqu'une entreprise décide d'installer un courrier électronique d'entreprise et des serveurs d'archivage, elle prend souvent des décisions organisationnelles telles que la décision de numériser tous ses documents. Tous les documents papier en entrée dans l'organisation sont alors numérisés dès leur entrée, gardés dans des endroits sûrs et seule la copie numérisée circule alors dans l'organisation. Cette façon de faire peut changer fortement l'organisation de la circulation de l'entreprise. En particulier, on peut en arriver à ce que la référence devienne le document électronique et que le document papier ne soit plus qu'une copie générée chaque fois que l'on souhaite une version papier pour un besoin précis, facilités de lecture, participation à une réunion etc… Ce cas est examiné plus loin. A noter cependant que l'introduction d'un système d'archivage peut aussi conduire à des dysfonctionnements passagers. Ainsi, il peut être nécessaire de scanner des documents disponibles sous un format électronique riche, simplement pour garder une trace d'une signature manuscrite sur la version définitive d'un document... Une solution qui perd toute raison d'être dès la mise en place d'un système de signature électronique.

107

Lorsque la structure de classement est homogène au sein d'une entreprise et qu'il existe un seul système physique d'archivage capable de contenir tous les documents de l'entreprise, la notion de contrôle d'accès peut être implémentée via des procédures classiques de liste d'accès ou de niveau de sécurité attaché au document ou à son classeur. D'autres solutions sont cependant possibles ; ainsi, il est possible que la clef d'accès au document soit elle-même le système de protection du document. Chaque document peut par exemple être rendu accessible par une clef dont la longueur rend improbable l'accès par recherche au hasard. L'auteur du document lorsqu'il dépose le document reçoit cette clef et contrôle ainsi l'accès au document par la transmission de celle ci. La clef donnant l'accès au document et permettant la transmission de celui-ci sous le contrôle de son possesseur, quel que soit le moyen dont celui-ci est entré en sa possession, le mode de contrôle d'accès est très semblable à celui du papier où possession du document permet son accès et sa transmission après photocopie.

1.30. Circulation de documents

De nombreux outils bureautiques disponibles sur le marché se proposent de favoriser le travail en groupe. De tels outils peuvent aller du système de suivi des procédures qui s'intègre parfaitement dans une entreprise traditionnelle, structurée et hiérarchique à l'outil d'aide au travail de comité qui propose une vision 'cellulaire' de l'entreprise où des groupes à durée de vie limitée sont formés pour résoudre des problèmes spécifiques, ces groupes se dissolvant pour permettre à leurs membres de participer à d'autres groupes dès que l'objectif du groupe est atteint.

L'idée de gérer les procédures administratives au moyen d'outils électroniques qui contrôlent le flux de document n'est pas neuve. Elle était même présente dès la première vague bureautique et entendait séduire des entreprises très structurées (telles les banques et les assurances) ou des administrations, où le flux des dossiers peut être formalisé facilement. Dans ces systèmes, un dossier est associé à une procédure. Une procédure est un ensemble de nœuds, chaque nœud représentant les étapes de la procédure. Entre les nœuds, il y a des arcs, chaque arc représentant une des décisions possibles à la fin du travail effectué à une étape. Physiquement les étapes d'une procédure sont représentées par des boîtes aux lettres (ou des bacs d'entrées) dans lesquels les documents attendent d'être traités.

L'implémentation du système de gestion du flux de document (workflow) peut se faire de différentes façons selon l'endroit où est représenté l'état de la procédure et la façon dont sont prises les décisions nécessaires pour passer à une étape suivante. On peut ainsi distinguer

108

Les systèmes centralisés dans lesquels les étapes et les arcs possibles, l'étape actuelle et les décisions prises pour passer d'une étape à l'autre sont contrôlées par une base de donnée centrale, le plus souvent relationnelle. Chaque fois qu'un document arrive dans une étape (chaque fois par exemple qu'il arrive dans une boîte aux lettres), un message est envoyé à la base centrale. Chaque fois qu'un gestionnaire d'un dossier décide de choisir une étape suivante, ce fait est aussi notifié à la base centrale. De la sorte, en examinant le contenu de la base centrale, il est possible de connaître à tout moment la localisation d'un dossier et son historique. Comme tout système centralisé, une telle façon de faire permet un contrôle strict sur le flux de document mais par contre suppose une gestion relativement lourde. A noter qu'un système centralisé peut aussi effectuer du routage automatique de document si, lors des échanges entre le document et le système central, le document communique certaines informations au système central.

Les systèmes décentralisés dans lesquels les boîtes aux lettres contiennent les informations concernant les documents qui les ont traversées et les règles pour passer d'une boîte aux lettres (d'une étape) à l'autre. Dans de tels systèmes, les boîtes aux lettres gardent une trace des documents qui y transitent. Elles peuvent aussi contenir des règles complexes qui en fonction du contenu du document (ou du moins de son enveloppe) effectue certaines actions. Ces actions peuvent être par exemple une redistribution des documents vers d'autres boîtes aux lettres en fonction de leur utilisation et de leur statut ou encore une réorganisation des priorités des documents à traiter. Le traitement n'impose plus l'appel à une base centrale, mais par contre une programmation des boîtes aux lettres. La recherche de la situation ou de l'historique d'un ou de plusieurs dossiers demande potentiellement l'interrogation de toutes les boîtes aux lettres. La gestion des circuits peut bien sûr être beaucoup plus décentralisée et suivre assez bien la répartition par hiérarchie des responsabilités, certaines boîtes aux lettres représentant des points de contrôle de haut niveau et d'autres représentant des circuits locaux capables de s'auto-organiser.

Les systèmes décentralisés dans lesquels les documents contiennent les informations concernant les étapes qu'ils ont traversées et les règles qui régissent leur routage. Bien entendu, dans de tels systèmes, les boîtes aux lettres doivent aussi être intelligentes parce qu'elles doivent être capables d'interpréter les données et les instructions de routage contenues dans le document. Mais contrairement au cas précédent, ces règles ne sont pas définies dans la boîte aux lettres mais bien dans le document. Cela permet de construire des documents intelligents capables de s'orienter pour rechercher l'information nécessaire et de demander une intervention humaine seulement lorsque toute l'information nécessaire a été rassemblée. De tels agents deviennent de plus en plus disponibles, non seulement au sein de l'entreprise mais même dans des réseaux inter-entreprise comme INTERNET. Bien entendu, une localisation d'un document particulier demande aussi potentiellement l'interrogation de toutes les boîtes aux lettres.

Les systèmes de gestions de procédure permettent aussi de gérer électroniquement des circuits d'approbation ou de visa. Il s'agit en fait d'informatiser les signataires d'attribution qui permettent à un responsable d'attribuer le courrier entrant ou les signataires d'approbation pour envoi qui permettent de s'assurer qu'une note officielle a bien toutes les signatures nécessaires avant envoi.

109

Dans le cas d'une base de donnée centralisée, ces visas peuvent simplement être l'écriture sécurisée d'une information dans la base de donnée. Dans les cas décentralisés, ces visas doivent faire appel aux techniques de signatures électroniques décrites dans les chapitres précédents.

On notera que les circuits de visa se heurtent souvent aux problèmes des 'pièces annexes' des dossiers (pièces justificatrices tels que factures, lettre recommandée etc...) dont l'original doit souvent accompagné le dossier papier non informatisé. La seule façon de contourner le problème est d'imposer une acquisition par numérisation de toutes les pièces justificatives comme décrit précédemment.

Ensuite le flux des documents non structurés doit être associé au flux de documents structurés. En général, les documents non structurés sont stockés dans un serveur ou plusieurs serveurs d'archivage ou ils sont identifiés par une clef d'archivage. Cette clef est associée à l'information structurée et sur demande la personne qui accède à l'information structurée (facture) peut demander une extraction sur le serveur d'archivage pour extraire tout ou une partie de l'information non structurée (pièce justificarice). En tout cas, dans de tels systèmes, une analyse est souvent nécessaire pour savoir où placer les serveurs d'archivage et déterminer s'il faut copier l'information non structurée (souvent fort volumineuse) de poste en poste, la laisser dans un serveur unique ou la dupliquer dans quelques serveurs ayant chacun une copie. On voit donc que dans ce domaine aussi l'archivage est étroitement lié à la circulation des documents. A noter cependant qu'à l'avenir tous les documents devraient arriver sous format électronique évitant ainsi la numérisation.

A coté de ces outils de gestion de flux de travail (workflow) s'appliquant plutôt à des entreprises traditionelles et structurées, on trouve aussi des outils chargés de faciliter le travail en groupe de façon plus informelle (workgroup ou groupware). Parmi ces outils, on trouve des systèmes spécialisés tels que les agendas électroniques ou des systèmes de diffusion décentralisés de type WWW (World Wide Web). Mais l'outil de référence reste Lotus-Note de la firme LOTUS.

Lotus-Note est un outil très particulier construit autour d'une base de données facilement réplicable. Pour Lotus-Note, un document est basé sur des enregistrements dans une base de donnée qui peut contenir des champs structurés, mais qui peut aussi contenir des champs de texte non structurés. Les champs structurés ont les types classiques et peuvent donc contenir des entiers, des réels, des dates etc... Ils sont interrogeables selon les critères classiques. Les champs texte peuvent contenir du texte et sont interrogeables selon des techniques de recherche 'full text'. Un document n'est donc que la création d'une 'vue' sur cette base de donnée. Chaque 'table' de la base de donnée correspond à un 'type' de document différent. On conçoit donc bien qu'un document conserve dans ces conditions un très haut niveau de richesse.

110

Le principal atout de Note est que les bases de données 'Note' sont réplicables. Cela signifie qu'un utilisateur qui veut recevoir des documents qui lui ont été envoyés par courrier, fait simplement une synchronisation entre sa base de donnée Note, présente par exemple sur son portable et une base de donnée de référence qui contient l'équivalent de boîtes aux lettres. De façon similaire, lorsqu'il souhaite envoyer un document à un ou plusieurs destinataires, il se contente d'indiquer ce fait dans la base de donnée de document dans laquelle il travaille. Après un certain temps, les mécanismes de réplication de Note feront en sorte que la portion de la base qui doit atteindre les destinataires sera copiée dans leur base.

Le mécanisme de réplication est contrôlé par un administrateur 'Note'. Celui-ci définit à quel rythme, un serveur Note entre en contact avec un ou plusieurs de ses voisins pour faire à jour les versions répliquées de leurs bases respectives. L'administrateur doit aussi définir les droits d'accès de chacun et il est clair que dans un tel système à réplication, les aspects de confidentialité et de sécurité sont importants.

Dans un tel système, la notion de courrier électronique peut être remplacée par celle de mise à jour de bases répliquées. Cette structure semble être de plus en plus la règle dans les applications bureautiques. Au lieu d'être en communication directe avec un serveur distant, un utilisateur bureautique est en communication avec une application bureautique locale qui lui fournit le service dont il a besoin et qui, selon les nécessités, contacte de façon asynchrone les autres applications bureautiques similaires éparpillées au sein de l'organisation.

Une telle approche asynchrone place moins de contrainte sur les lignes de télécommunication et se prête mieux à satisfaire les besoins des nouveaux types d'utilisateurs tels que les utilisateurs mobiles. Comme chaque utilisateur a sur son PC une copie de toutes les 'applications' de l'entreprise (mais seulement un sous-ensemble des données), on parle de 'super-fat client' (client super gras). Ce modèle est très différent d'un autre modèle possible pour les utilisateurs mobile, où celui-ci n'a pratiquement qu'un 'browser standard' (visionneur standard) et où il accède en mode client-serveur à l'ensemble des données de son organisation. Ce modèle de 'ultra-thin' client (client super mince) est celui du WWW. Les 2 modèles ont des attentes très différentes en matière de réseau. Le modèle 'super-fat' suppose que le réseau est accessible assez difficilement, a des temps de réponse assez longs mais est capable de débits moyens importants (pour faire une resynchronisation). L'autre modèle suppose un réseau accessible facilement et avec des temps de réponse assez courts.

Dans la pratique, toutes ces structures de communications peuvent être mélangées entre elles. Un serveur de réplication pourra s'appuyer sur un courrier électronique ou sur des interactions 'client-serveur' pour répliquer ses documents. A l'inverse un système de réplication peut être utilisé pour implémenter un système de courrier électronique.

111

Un autre point intéressant à noter est que le but de tout système de communication étant d'optimiser l'utilisation du réseau tout en fournissant des temps de réponse acceptable, il est important de trouver le juste compromis entre la réplication de documents sur de multiples serveurs (qui demande de la capacité de stockage et de la bande passante entre les serveurs pour répliquer des documents qui ne seront peut-être jamais demandés) et la nécessité parfois d'accéder à des serveurs lointains pour récupérer certains documents non disponibles localement. Comme déjà mentionné, ce compromis peut être plus facilement trouvé s'il existe un service de répertoire gardant une trace des différentes localisations des documents et des endroits les plus proches où ceux-ci sont disponibles.

1.31. Internet, intranet, extranet

1.31.1. La révolution WEB

L'arrivée du WEB a profondément bouleversé le monde de la diffusion des documents.

Le WEB a d'abord apporté une révolution parce qu'il permet une identification unique du document via l'URL. Cela est important parce qu'il n'est plus nécessaire d'envoyer un document pour y avoir accès.

Le WEB a apporté aussi une révolution pour les raisons suivantes:

Le WEB a défini un standard en matière d'interface grâce à la définition du HTML et aux protocoles qui le supportent: TCP/IP et HTTP.

Le WEB est une organisation de bases documentaires qui visent à présenter à l'utilisateur un monde "unifié" de documents se référant les uns aux autres tout en permettant une mise en œuvre décentralisée sur des serveurs différents.

Le WEB a entraîné dans son sillage d'autres formes de communication : création de newsgroups où les membres d'une communauté peuvent créer des chaînes de messages se répondant les uns aux autres, possibilité pour le courrier électronique de véhiculer des références aux documents, possibilité de créer facilement des documents dynamiques ou disposant d'animations, possibilité de créer des mondes virtuels et d'en offrir l'exploration.

Le WEB est une infrastructure permettant l'accès à partir de média de communication de caractéristiques très différentes telles que les lignes téléphoniques normales et les réseaux locaux à haute vitesse d'entreprise.

112

1.31.2. INTERNET

La première manifestation du WEB a été dans le domaine de l'INTERNET, un réseau mondial qui s'est développé de façon exponentielle. Sa caractéristique principale est d'être un réseau qui n'est pas géré globalement. Toute décision telle que l'établissement d'un nouveau site ou l'établissement de nouveau nœuds ou de nouvelles lignes est "locale" c-à-d ne demande pas une coordination ou l'approbation d'une hiérarchie. Et malgré ce caractère local, ce réseau est extrêmement résilient même en présence de fortes charge. Son mode de financement est local aussi et est géré par des accords de proximité. Le financement se fait au débit maximal mis à disposition et les conventions de service garantissant un débit effectif sont assez difficiles à mettre en œuvre. Au sein de ce réseau de grands groupes se mettent en place pour pouvoir justement garantir un débit de bout-en-bout à un ensemble de clients.

Une caractéristique importante d'INTERNET est son mode de tarification basé essentiellement sur un forfait de coût assez faible et sur le paiement, à la durée, du coût d'une communication locale (ou d'une ligne point à point avec un point d'accès). Ce mode de tarification convient bien à une entreprise, qui n'est pas ainsi obligée de budgétiser des coûts variables.

Les entreprises ont bien sûr découvert en INTERNET un moyen de faire découvrir leur produit à un coût beaucoup plus faible que les technologies basées sur la diffusion actives telles que les mailing traditionnels. De plus, la possibilité émergeante de faire des transactions sur le WEB a réduit le temps entre l'impact d'une publicité et un éventuel passage à l'acte d'achat.

Paradoxalement, le WEB qui est une technique permettant une large décentralisation est en fait devenu assez vite dans la pratique un outil de centralisation de la fonction de diffusion du message d'une entreprise vers le monde extérieur. Il est vite devenu apparent en effet qu'une entreprise ne pouvait pas diffuser sur un réseau par essence mondial une image fragmentée d'elle même et, après une période anarchique assez brève, toutes les entreprises importantes ont confié à un comité éditorial interne puissant le soin de veiller à ce que les messages qui étaient diffusés étaient consistants tant dans la forme que dans le fond.

1.31.3. Intranet

Très vite aussi, les technologies WEB sont apparues au sein de l'entreprises pour remplir une série de fonctions:

Diffuser de l'information par exemple administrative, dont l'utilisateur n'a besoin que sur demande.

Diffuser de l'information générale dont la fraîcheur doit être grande (news).

Assurer la promotion interne pour les départements ou les projets.

Dans certains permettre l'animation de forum de discussions.

113

A côté de ces applications traditionnelles de la technologie de pages statiques, le WEB a aussi été utilisé comme substitut du courrier électronique en cas de distribution à un grand nombre de destinataires. Il faut cependant souligner que le WEB ne permet pas un avertissement de la présence d'un message et que son succès dans ce rôle dépend et de l'organisation des serveurs et de la discipline des usagers.

Et puis, surtout, le WEB a été vu comme une chance unique de reconstruire les systèmes d'information traditionnels de l'entreprise sous un interface unifié, convivial, puissant, intégrant naturellement information structurée et information non structurée (c-à-d en pratique à richesse de représentation faible) et permettant de construire des systèmes client-serveur où le client est un client léger. Une annexe technique décrit la problématique des approches client-serveur qui est une approche où un morceau de programme se trouve sur le PC proche de l'utilisateur (et donc de l'interface utilisateur) alors que l'autre partie (le serveur) se trouve près des données. Le modèle client-serveur est très utilisé parce qu'il optimise la ressource la plus coûteuse qui est le réseau et conduit naturellement à développer les logiciels sous forme de composants réutilisables. Néanmoins l'approche traditionnelle pose des problèmes de déploiements des systèmes puisqu'elle oblige à placer un logiciel spécifique à chaque système sur chaque PC. L'approche WEB, met un seul logiciel sur le PC (le browser) et permet de réduire significativement les coûts de déploiement des systèmes, les coûts de support et la puissance des PC.

Cette approche WEB aux systèmes d'information touche bien sûr aussi toutes les systèmes de support de la bureautique tels que l'accès au courrier électronique, l'accès aux fonctions d'agenda, de signataires électroniques ou d'archivage de document.

La maintenance d'un site WEB au niveau d'un département est de plus en plus le ressort de personnel de secrétariat que du ressort du personnel spécialisé informaticien. Les sites WEB départementaux comprend de plus en plus un outil de téléchargement automatique qui permet de placer un document WEB dans une rubrique d'une arborescence prédéfinies par un ensemble de pages. Un document WEB est lui-même une sortie un peu particulière d'un traitement de texte classique. Les textes ainsi téléchargés sont souvent indexer automatiquement par le moteur de recherche associé au WEB.

Bien qu'à un utilisateur, un interface WEB puisse présenter les mêmes caractéristiques qu'un système d'archivage, les deux systèmes sont très différents :

Dans un système d'archivage, on a 2 types d'objets : les répertoires organisés en hiérarchie et les documents. La structuration est donc forte.

Dans un système WEB, il n'y a qu'un seul type d'objet: le document WEB. Les hiérarchies de répertoires sont donc simulées par des hiérarchies de références entre documents et l'insertion d'un nouveau document dans un dossier demande une mise à jour explicite du document "père" dans la hiérarchie.

114

1.31.4. Extranet

Un extranet est le prolongement d'une infrastructure intranet vers un ensemble de correspondants privilégiés à l'extérieur. Il s'agit souvent de relation entre un fournisseur et ses clients habituels. La personne qui a accès à l'extranet d'une entreprise doit s'authentifier et en fonction de cette authentification, elle a accès à certaines informations ou certains systèmes d'information. Les extranet se développent aussi actuellement et c'est dans ce domaine que des standards tels que XML sont importants parce qu'ils permettent d'imaginer des extranet entre systèmes et non plus entre personnes et systèmes.

1.32. Architecture bureautique

Les discussions des chapitres précédents ont montré la diversité des outils présents et la nécessité pour une entreprise de mener des choix cohérents si elle veut obtenir des solutions d'un coût acceptable. Ces choix se matérialisent par une architecture informatique dont l'architecture bureautique est un cas particulier, par une organisation et par une politique d'achat de produit. Le présent chapitre se focalise sur le choix d'architecture.

L'architecture bureautique est tout d'abord influencée par la culture de l'entreprise et en particulier sur son caractère centralisé ou décentralisation. Le débat entre centralisation et décentralisation est un débat très général et n'a pas de réponse absolue. On peut dire

Que la décentralisation est une technique utilisée lorsque les ressources disponibles sont largement inférieures aux besoins ou lorsque ces derniers sont difficilement quantifiables. La décentralisation permet alors un ajustement précis des priorités, impossible à faire avec des approches centralisées. Dans l'histoire de la bureautique, l'arrivée des PC a coïncidé avec une période de décentralisation, par seulement parce que le PC était un outil "personnel" mais surtout parce que les coûts pour placer des PC partout et les fédérer dans des réseaux d'entreprise était trop élevé à cette époque.

Que la centralisation est utilisée lorsqu'il est important de diminuer la quantité globale des ressources consommées, même au prix d'une moins bonne adaptation des solutions proposées aux besoins individuels. Les choix centralisés amènent à une cohérence qui rend plus facile l'interaction entre des entités différentes.

On voit donc qu'assez paradoxalement une entreprise à la culture très décentralisée, où chaque entité (département, direction etc...) possède une autonomie importante, peut exiger une informatique et une bureautique assez centralisée, pour permettre que les centres autonomes de décision puissent communiquer. Dans le monde informatique, l'exemple d'un tel paradoxe est l'INTERNET où l'autonomie absolue de gestion de chaque nœud se paie par une rigidité presque totale en matière de protocole de communication.

Une entreprise centralisée va donc regrouper le stockage de ses documents sur quelques serveurs de taille importante. Une entreprise plus décentralisée va multiplier les serveurs de petites tailles. Une entreprise à la culture bureautique anarchique va laisser chaque utilisateur gérer le stockage de ses documents sur son propre PC. Cette solution est évidemment la plus coûteuse.

115

La décentralisation peut se faire selon les lignes organisationnelles c-à-d par direction et département et, au niveau de la gestion des documents eux-mêmes c'est la seule solution rationnelle, puisqu'elle permet à des personnes qui travaillent ensemble sur un même sujet de partager une zone de stockage de documents gérée en commun.

Au niveau de l'infrastructure physique, cette solution est aussi souvent utilisée mais ce n'est pas la seule possible. Ainsi les serveurs, les photocopieurs, les imprimantes, les télécopieurs et les scanners peuvent être liés au bâtiment au lieu d'être lié à l'organisation. Ce mode de gestion rejoint celui des autres commodités comme le réseau électrique, le réseau téléphonique et de plus en plus souvent le réseau de transmission de données. Même des activités comme le "support" des utilisateurs (help desk) peut être avantageusement organisé par bâtiment, plutôt que selon la hiérarchie de l'entreprise.

Lorsqu'il y a une certaine décentralisation, il est aussi important de distinguer entre décentralisation et déconcentration. Dans une entreprise décentralisée, les départements ou les directions ont des responsabilités autonomes en matière de gestion de leur bureautique (support à l'utilisateur, gestion de l'infrastructure) et parfois en terme de recherche et de mise en place de solutions (ingénérie). Dans une entreprise déconcentrée, le service informatique central place du personnel appartenant à ses services auprès des départements pour en assurer la gestion. La différence entre décentralisation et déconcentration est facile à faire en examinant l'autonomie budgétaire.

L'architecture bureautique sera le plus souvent une architecture à 2 niveaux, un niveau central et un niveau départemental.

Le niveau central sera en charge de la gestion du réseau, y compris le réseau de support du courrier électronique. Il sera en charge du centre de télécommunication par lequel devront transiter tous les trafics entrant et sortant. Ce centre de télécommunication a pour but d'éviter l'intrusion de messages dangereux et de contrôler l'accès externe aux ressources internes. Ce rôle sera de plus en plus important au fur et à mesure que se développent les besoins des utilisateurs mobiles et des personnes utilisant le télétravail. En accès sortant, le centre de télécommunication contrôle le coût et parfois les sites visités...

Le niveau central gérera aussi souvent toute l'infrastructure WEB de diffusion au niveau de l'entreprise. Il veillera aussi à l'homogénéité des documents placés sur le WEB.

Outre ces 2 fonctions opérationnelles (et ses fonctions d'ingénierie au travers desquelles il assure la cohérence de l'ensemble des choix notamment en matière de format d'échange de documents), le niveau central peut aussi offrir des capacités d'archivage longue durée, des services de gravures de CD-ROM (CD-R), des services d'impression papier à haut débit. En fait, il existe toute une série de fonctions qui peuvent être offertes avantageusement par les services centraux si ceux-ci le souhaitent et en ont les moyens.

116

Le second niveau est en charge de gérer le stockage des documents (serveur) et la configuration de l'utilisateur final. Selon le cas, l'utilisateur stockera ses documents sur son PC avec sauvegarde automatique périodique ou les sauvera uniquement sur le système d'archivage du serveur. Cette dernière solution est nettement préférable parce qu'elle évite de devoir faire des sauvegardes périodiques de l'ensemble des documents présents sur le PC d'un utilisateur. Elle permet surtout de configurer les PC pour en faire des outils banalisés qui ne sont plus attachés à l'utilisateur. Le PC peut alors dans ce cas, lui aussi, est lié au bâtiment comme le téléphone.

Une architecture doit répondre à quelques questions dont la réponse peut paraître aller de soi mais qui demandent une révision périodique. Parmi celle-ci, une des plus pertinente est celle du choix du poste de travail utilisateur. Aujourd'hui, il semble évident que le poste de travail d'un utilisateur doit être un PC. Pourtant, autant un PC est un choix judicieux pour des activités personnelles ou familiales, autant, au sein d'une entreprise, le choix PC est un choix coûteux en terme de gestion. Le PC est en effet un outil trop personnel. Même contrôlé à distance, le PC permet à son utilisateur de le personnaliser et cette personnalisation pose souvent des problèmes difficiles à détecter. Cette personnalisation prend souvent l'aspect de l'introduction non contrôlée de nouveau programmes qui, même s'ils ne sont pas infectés par des virus, peuvent créer des incompatibilités avec l'environnement standard de travail.

Un PC est aussi un outil complexe pour l'utilisateur final, même si la disposition à la maison du même appareil tend à diminuer ce problème.

Enfin, la spirale des puissances des PC et le maintien des coûts à un niveau élevé à capacité de travail constante, joint avec le caractère inacceptable des cycles d'amortissement pousse les départements financiers à chercher des solutions alternatives.

Plus fondamentalement, il y a un paradoxe inacceptable à obliger l'utilisateur à changer fréquemment de PC pour passer à des niveaux de puissance supérieure, simplement pour lui permettre de continuer de faire le même travail bureautique (traitement de texte, tableur) sans guère de valeur ajoutée réelle depuis quelques années. Et cela d'autant plus qu'en matière de systèmes d'information, la tendance est de s'éloigner de la solution client-serveur traditionnelle avec son 'fat client' (client lourd) pour revenir à des solutions plus légère basée notamment sur le 'browser' universel WEB.

Aussi, de nombreuses entreprises souhaitent elles l'émergence de solutions plus orientées 'terminal' qu'il s'agisse de "terminaux windows" ou de NetPC (browser WEB). Les terminaux windows, font tourner les applications sur un serveur et transmettent leurs informations sur le réseau. Les NetPC sont des browser WEB qui se comportent comme des terminaux intelligents. Le problème est que cette solution s'adapte mal à la bureautique en l'absence de logiciel bureautique spécifiquement construits pour ce type de terminal.

117

D'autres questions architecturales concernent le type de machines à utiliser pour accomplir le stockage des documents. Ces machines étaient jusqu'il y a quelques années des machines UNIX. Les divergences entre les différents idiomes UNIX, l'absence de standardisation en matière d'outil de gestion de machine a pratiquement détruit ce marché, à l'exception de quelques fournisseurs, au profit de NT qui a l'avantage de pouvoir fonctionner aussi bien sur les PC que sur les serveurs et est un système d'exploitation assez robuste.

En ce qui concerne le stockage des documents, un point important est de choisir un système de stockage parmi les possibilités déjà décrites: utilisation simple du système de fichier, outil spécialisé, outil associé au courrier électronique ou encore outil associé à une base de donnée structurée.

L'organisation des serveurs WEB pose des problèmes similaires avec le choix des outils, l'organisation des serveurs et des chaînes de production, la mise en place de l'infrastructure et de l'organisation capable de maintenir la cohérence de la base de document WEB. Un problème annexe est le choix d'un outil de recherche documentaire facilement intégrable avec l'environnement WEB.

Enfin l'architecture doit traiter aussi l'organisation de l'interface entre le monde papier et le monde électronique. Politique en matière d'imprimantes (personnelle ou partagée ?), en matière de télécopie (remplacement par des serveurs), de scanners (outils autonomes ou couplés à des PC spécialisés) et l'organisation qui accompagne ces choix (maintenance des équipements, aide à l'utilisateur, politique de numérisation des documents).

1.33. L'entreprise classique orientée "papier" et la bureautique

1.33.1. Introduction du traitement de texte

Dans une entreprise classique, la référence reste le document papier. La bureautique sert juste à faciliter la création et la modification de documents.

118

Chapitre 6: Intégration de la bureautique dans l'organisation

L'outil le plus populaire est le traitement de texte ou le tableur. D'autres sources de documents sont les extractions des bases de données. Le principal avantage du traitement de texte est la possibilité de réviser les textes. Les textes sont donc produits en "draft", revus imprimés et ensuite signés et envoyés. A partir de cet instant, ils suivent le circuit classique réservé aux documents papier: photocopie, enregistrement en sortie, transport manuel, mise dans des bacs 'boîtes aux lettres', enregistrement en entrée, échange chef secrétaire pour l'attribution et le classement, classement proprement dit. Lorsque le document est urgent, il va être faxé.

Dans son trajet, un même document va être reproduit en une multitude d'exemplaires. L'envoi d'origine va se faire en mettant en copie un nombre important de personnes qui doivent être au courant de l'envoi, tant vers les supérieurs hiérarchiques que vers les collègues et les collaborateurs. A l'arrivée, le document va descendre la structure hiérarchique en se reproduisant une ou plusieurs fois à chaque échelon. Chacune de ces copies va être archivée chez l'auteur, le destinataire principal et toutes les destinataires en copie tant à l'origine qu'à la destination. A chaque niveau, des enregistrements d'entrée et de sortie vont permettre de suivre le document et de retracer, si nécessaire, l'historique de son trajet.

L'informatisation va éventuellement toucher d'autres domaines que la simple production de texte: de nombreuses entreprises utilisent des chrono électroniques, qui permettent de retrouver plus facilement le document et des échéanciers qui permettent de suivre les délais de réponse à un document donné. Souvent d'ailleurs les 2 outils sont combinés, puisque le chrono va enregistrer le classement et l'attribution du document pour traitement et fixer une échéance à son responsible pour produire une action.

Il est facile de voir qu'une telle organisation n'est pas efficace. Bien sûr le traitement de texte permet des gains de productivité en évitant la frappe complète du texte en cas de modification. Mais le temps perdu est important au niveau de la photocopie de document et de son enregistrement. Les multiples copies génèrent une inflation de papier et de besoin de stockage. Il est en plus très difficile de définir un plan de classement réellement harmonisé parce qu'il est très difficile de partager des dossiers (à cause de l'impossibilité de définir facilement qui a accès à quoi dans un système de dossier partagé si on ne possède pas une personne dédicacée à la gestion des accès) et que, en l'absence de partage de dossiers, il est impossible d'imposer un plan de classement unique. Parfois dans une hiérarchie, le responsable de la hiérarchie peut décider de ne pas garder une copie des dossiers à son niveau, mais cela suppose qu'il ait confiance dans la capacité de ses collaborateurs de classer et d'indexer convenablement leurs documents.

119

Une autre source d'inefficacité provient de la nécessité de réencoder éventuellement plusieurs fois l'information. Cela est particulièrement le cas pour des tableaux de chiffres où leur transmission par papier impose un réencodage chez l'expéditeur. Mais c'est aussi le cas des formulaires. Produits par machine à écrire ou par un outil spécialisé, la circulation de formulaires papier donne lieu à des réencodages dans de multiples bases de données, surtout dans le cas d'organisation relativement décentralisées où chaque niveau de hiérarchie maintient un système d'information destiné à valider l'acceptabilité de la demande véhiculée par le formulaire. C'est enfin le cas pour tous les documents qui sont le résultat de procédures complexes de négociation ou le résultat d'aggrégation de travaux d'entités plus petites où chaque niveau va devoir manuellement recréer un document de synthèse à partir des éléments fournis.

Les premières utilisations du traitement de texte consistaient le plus souvent à créer un texte, à attendre sa forme définitive puis à le détruire en machine. Avec le temps et les coûts décroissants des outils de stockage informatiques, de plus en plus de services auteurs vont conserver une copie électronique qui leur permet de reprendre un texte pour l'incorporer à un autre document longtemps après sa publication officielle. De tel stockage de document sont réalisés sur base d'un plan de classement linéaire, reprenant, par année, le numéro de chrono du document.

La bureautique utilisée à ce niveau pose peu de problèmes de compatibilité. Chaque ilôt d'informatisation peut utiliser la technologie qu'il souhaite puisque le format d'échange standard est le format le plus pauvre qui soit : le format papier (pixel).

1.33.2. Introduction du courrier électronique

Par rapport à cette entreprise à l'exploitation minimale de la bureautique, l'étape suivante correspond souvent pour une entreprise à se doter d'un courrier électronique. Les débuts du courrier électronique se font surtout autour d'un petit groupe qui se dote d'un outil commun. Les raisons principales pour l'introduction d'un courrier électronique sont les suivantes:

Le courrier électronique introduit un nouveau mode d'interaction à mi-chemin entre le téléphone et la note officielle.

Le courrier électronique permet d'envoyer des versions riches des documents, donc des versions révisables.

Le courrier électronique (ou pour être précis la messagerie électronique), introduit en effet un nouveau mode de communication dont les avantages sont nombreux:

Il est pratiquement aussi rapide que le téléphone.

Il n'est pas disruptif comme le téléphone.

Il laisse des traces, contrairement au téléphone,

Il n'est pas formel comme une note officielle.

120

Ce moyen de communication a aussi quelques défauts:

Il impose la frappe du document, une activité que les gestionnaires de haut niveau estime plus ou moins inconsciemment dégradante et qui est pour beaucoup assez lente.

Il ne permet une interaction en temps réel comme le téléphone.

… et surtout, il ne possède pas un contrôle de flux naturel comme le téléphone. Une personne sollicitée par téléphone impose pratiquement un contrôle sur le flux de ses appels simplement parce que qu'elle ne peut prendre qu'une communication à la fois. Son secrétariat peut filtrer ses appels et arranger les priorités de ceux-ci . Et l'essentiel est que tant que la communication n'a pas eu lieu, le message n'est pas supposé être parvenu et celui-ci n'a pas pu prendre des actions suite à ses appels. Mettre des priorités dans les appels revient finalement à mettre des priorités dans ses actions.

Le courrier électronique, lui, n'a pas ce contrôle de flux. L'émetteur n'est jamais bloqué lorsqu'il tente d'envoyer un message à un destinataire (sauf cas particulier) et le destinataire est supposé "responsable" de vider celle-ci et de lire son contenu. Si on ajoute à ce problème celui du "junk mail", on voit que le courrier électronique peut vite poser plus de problèmes qu'il n'en résout.

Le courrier électronique donne aussi pour la première fois la possibilité d'échanger des documents de niveau de richesse arbitraire. Cela va entraîner une révolution dans l'entreprise en l'obligeant à définir des choix harmonisés de formats d'échange, basés le plus souvent sur les formats des outils utilisés pour produire les documents. Cette harmonisation ne va pas se faire sans problèmes, notamment parce que les services qui ont choisi le mauvais format, vont perdre l'accès aux documents dont ils sont l'auteur qui ont été conservés pour réemploi. La bureautique cesse définitivement d'être un choix individuel pour devenir un choix d'entreprise.

Un des problèmes que soulève rapidement le courrier électronique en ce qui concerne les formats est le format à choisir en cas de l'évolution du produit commun choisi. Une évolution synchronisée étant impossible pour toute entreprise de taille importante, le format pris comme référence sur le courrier électronique doit être le format le plus ancien. Il est en effet difficile pour le destinataire d'un message utilisant le format le plus récent de lire celui-ci si ce destinataire que dispose que des outils se rapportant à l'ancienne version.

Comme déjà signalé, il est important que les outils de lecture soient efficaces. En effet, de nombreux messages peuvent être lus en quelques secondes. Il est donc important que l'outil de visualisation soit capable d'afficher le texte en maximum 2 secondes. Il est aussi préférable d'utiliser un outil de visualisation spécialisé disposant de faciliter pour parcourir rapidement le texte plutôt que d'utiliser simplement le traitement de texte pour effectuer la visualisation.

121

Un des problèmes qui se pose rapidement dès que le courrier électronique se répand dans une entreprise est celui de l'interaction chef secrétaire. Dans le traitement du courrier "papier", le circuit classique se fait par arrivée du courrier au secrétariat, son placement dans des signataires selon un ordre de priorité à des fins d'attribution et de classement (souvent avec une proposition de classement), sa lecture par le responsable et son retour au secrétariat pour action. Dans le cas de courrier électronique, un fonctionnement similaire est aussi possible. Le courrier est redirigé automatiquement vers la boîte aux lettres du secrétariat, il est imprimé et suit ensuite le chemin classique. L'inconvénient de cette méthode est que le courrier électronique cesse d'être un moyen de communication rapide plutôt semblable au téléphone. Un autre inconvénient est que la possibilité de faire des réponses rapides (reply) est perdue.

Une alternative est de rediriger le courrier sélectivement selon certains critères. Ainsi le courrier qui comprend des "attachment" est transmis au secrétariat tandis que les courts messages sont traités directement par le responsable et éventuellement transmis ensuite au secrétariat pour traitement plus complet.

Le problème du courrier électronique chef-secrétaire se complique en cas de classement électronique. Ce point est examiné plus loin.

Enfin, comme le courrier électronique n'est pas la référence, il ne peut être utilisé que pour des messages non officiels, des versions "draft" ou comme "copie rapide" des messages envoyés ensuite par courrier papier. Il est donc fréquent que des messages soient reçus en deux copies, une officielle, papier et portant la signature et une "rapide", électronique et ne portant pas la signature.

1.33.3. Enregistrement et archivage

L'informatisation peut concerner aussi l'enregistrement et l'archivage. L'enregistrement électronique du courrier d'entrée et de sortie a pour avantage de faciliter la recherche de l'information et le suivi de procédures formelles via des échéanciers. Il est cependant important avec ces outils d'enregistrement que le temps nécessaire pour faire l'enregistrement soit compatible avec la fréquence de la recherche d'un document.

L'introduction du courrier électronique pose aussi la question de savoir ce que faire avec les documents reçus. Une des possibilités est simplement de les détruire. Une autre possibilité est d'archiver les documents. Cela ne se justifie cependant pas, tant que le document de référence reste la copie papier... Seuls des documents où une partie du document est réutilisable (des tableaux par exemple) méritent d'être archivés électroniquement.

122

1.34. Quand l'électronique devient la référence

1.34.1. Les principes

Dans de nombreuses organisations, le document électronique commence à être la référence au moins pour certains types de document. Cela ne signifie pas que le papier cesse d'exister ; le rêve du "paper-less" office n'est plus crédible depuis longtemps. Mais le papier devient une simple copie "lisible sans instrument" du document électronique qui, seul, est le document officiel.

La chaîne bureautique dans ce cas doit être complète. Le document est entré par frappe ou par numérisation. Il est archivé dans des systèmes d'archivage que ce soit chez l'auteur, entre sa création et son envoi officiel, que chez le destinataire d'un envoi, envoi qui obligatoirement doit être fait par courrier électronique.

Le premier problème est celui de l'authentification des documents. Au sein de l'entreprise, pour des documents courants, l'authentification peut être basée sur celle du courrier électronique. Le seul problème est que cette authentification n'accompagne pas le document mais seulement sa transmission par courrier. Dès qu'il est extrait de l'infrastructure de courrier, cette authentification n'est plus liée au document et il est impossible de reconnaître un document signé d'un document non signé. Néanmoins, pour de tels documents courants, une simple mention "signé", peut suffire pour reconnaître un document "draft" d'un document "signé".

Pour des documents plus officiels, il est nécessaire d'introduire des mécanismes de signature plus formelle telle que des signatures électroniques. Celles-ci imposent cependant d'abord de mettre en place un mécanisme de certification. Ou d'affilier l'entreprise à un organisme de certification existant. Il faut aussi que la législation accepte la signature électronique dans le domaine concerné.

Les documents papier entrant dans l'entreprise sont numérisés à leur entrée. Cette numérisation peut être centralisée ou être décentralisée. Le document numérisé authentique est gardé et associé à sa représentation numérique. Celle-ci peut être signée par le service en charge de la numérisation.

1.34.2. L'organisation du stockage

Lorsque le document de référence est le document électronique, celui-ci doit être archivé. A priori, chaque utilisateur pourrait organiser le stockage comme il l'entend. Si le stockage se fait avec sur base d'un système central où chaque utilisateur place dans son système de stockage les références aux documents, cela ne pose pas de problèmes particuliers en terme de capacité de stockage. Si, par contre, le stockage se fait par copie physique du document dans le système de stockage, le document va se retrouver stocker en autant d'exemplaires qu'il n'y a de destinataires, ce qui multiplie la capacité de stockage d'un facteur deux au minimum (stockage chez l'expéditeur et stockage chez le destinataire) et plus fréquemment d'un facteur 5 à 10.

123

Aussi, comme ce dernier cas est le plus fréquent, l'introduction d'un système d'archivage électronique donne lieu à une tentative de rationalisation du stockage par la création d'une nomenclature harmonisée de classement au niveau départemental ou global de l'entreprise. Cette nomenclature est ordinairement une arborescence (une hiérarchie).

L'avantage d'une nomenclature de classement est de permettre une navigation à travers le classement. Une hiérarchie se prête aussi naturellement à des extensions, lorsque certaines nouvelles activités apparaissent dans l'organisation. Les premiers documents liés à la nouvelle activité peuvent être liés à une activité plus générale. Lorsque le nombre de documents se multiplient et que l'activité prend un caractère officiel, les documents précédent la décision de créer une nouvelle subdivision de la nomenclature peuvent être reclassés.

Créer un système de classement harmonisé est une tâche difficile. La tête de classement peut être basée sur le temps (par exemple l'année ou l'année fiscale), ce qui facilite l'archivage longue durée des années précédentes mais impose souvent un mécanisme de report d'une année à l'autre pour les documents pluri-annuels. Ceux-ci sont de 2 types:

Des documents de référence qui sont valides en permanence ; ces documents peuvent être placés en dehors de la partie chronologique de l'arborescence. Ces documents peuvent être placés sur un intranet d'entreprise ou un intranet départemental.

Des dossiers pluri-annuels ; ceux-ci doivent être reportés d'une année à l'autre.

Comme tout système hiérarchique, un système de classement est difficile à constituer parce qu'il y a plusieurs "attributs" de documents susceptibles de constituer la classification. Ainsi on peut avoir une partie de la classification qui se base sur l'organisation hiérarchique (ce qui est personnel, départemental et global à l'entreprise), une partie de la classification qui se base sur le type de document ou le contexte de leur utilisation (documents se rapportant à une réunion donnée, compte-rendu, expertises, formulaires...) et une partie de la classification qui se base sur une hiérarchie de "thèmes" ou d'activités. Il est bien sûr difficile de donner l'ordre de priorité de ces différents axes de classement de façon à satisfaire tous les utilisateurs.

Une solution à ce problème est de ne pas avoir une hiérarchie de classement mais plusieurs et de rattacher le document simultanément à chacune de ces hiérarchie. On peut voir ce système comme attachant au document plusieurs attributs, chaque attribut correspondant à un axe de classement. Cette façon de faire est efficace quoique peu habituel.

Un des problèmes habituel d'un système de classement est l'appartenance de certains documents à plusieurs dossiers. Un classement électronique permet de résoudre facilement ce problème par le copiage de référence au document (shortcut) ou par référence du document à plusieurs nœuds de l'arborescence de classement.

124

Lorsque la nomenclature est commune à toute l'entreprise, chaque département est département doit s'y intégrer. Si la subdivision en département suit l'organisation de la nomenclature, l'utilisation de la nomenclature n'est pas trop difficile. Si ce n'est pas le cas, il peut être difficile pour les départements de s'y intégrer, sauf si l'outil de gestion du classement gère la façon dont le classement apparaît à chaque département.

Choisir le système de stockage est une décision difficile pour une entreprise. Il existe différents systèmes de stockage, depuis le plus simple lié au système de fichier du système d'exploitation, trop simple et trop peu protégé pour une utilisation autre que départementale jusqu'au système intégré de type Lotus note en passant par des produits liés au WEB ou à des bases de données documentaires ou relationnelles. L'important est que le système choisi par une entreprise soit uniforme et en particulier qu'il y ait un moyen unique de référencer un document. Cette clef d'accès permet alors d'éviter la transmission du document quand cela n'est pas nécessaire en transmettant la référence plutôt que le document. Cela est particulièrement important lors de l'usage du courrier électronique au sein d'un département. Un département se manifeste en effet par une structure de classement qui devrait être homogène pour l'ensemble du département et par un partage de ceux-ci entre les membres du département. Transporter les documents entre membres d'un même département n'a donc aucun sens dans ce cas. Seule la transmission de référence est utile.

1.34.3. Les outils d'acquisition et de restitution

Dans le monde "papier", la photocopieuse, l'imprimante et le fax sont des outils très différents. Le "scanner" n'est pas un outil vraiment nécessaire sauf pour des tâches bien précises liées à l'édition.

Lorsque le document électronique devient la référence, les fonctions importantes sont celles de numérisation qui permettent de passer du monde papier au monde électronique et celles d'impression qui permettent de passer du monde électronique au monde papier. En principe les télécopieurs (fax) devraient disparaître en tant qu'outil ainsi que les photocopieurs.

Les télécopieurs, comme les photocopieurs numériques modernes, ne sont en effet que le couplage d'un scanner et d'une imprimante. Dire que ces deux outils devraient disparaître signifie que des machines qui passent du papier à un monde électronique pour ensuite repasser au monde papier sans possibilité de traitement du format électronique n'ont pas de sens dans un monde où le document électronique est la référence.

A l'avenir et au moins pendant une période de transition, il est probable que des machines combinant "numérisation" et "impression" vont devenir très fréquentes. Ces machines permettront certainement aussi de faire des photocopies et de transmettre des télécopies, mais leur vraie utilisation sera soit de numériser de façon massive des documents à stocker dans le système d'archivage, soit d'imprimer rapidement des documents papier. Parce que ces machines pourront être utilisées comme des photocopieuses classiques, elles faciliteront le passage du monde où le document papier est la référence à un monde où la représentation électronique est la référence.

125

Dans l'immédiat, la numérisation massive de documents pose encore problème. Tout d'abord, parce que la numérisation demande l'association entre un lieu d'archivage électronique (avec son indexation) avec un document papier physique. L'outil de numérisation doit donc offrir des fonctions d'accès au système d'archivage pour permettre de sélectionner l'endroit où seront stockés les documents. L'alternative est de préparer des feuilles d'entête avant chaque pile de document à numériser. Ces feuilles d'entête doivent fournir toutes les informations nécessaires sous forme de code-barre lisible par le scanner. Celui-ci traite alors séquentiellement chaque lot séparé par une feuille d'entête en générant après chaque lot un document de statut. Plutôt que d'associer un lieu d'archivage, une alternative est de donner une adresse électronique où le document numérisé doit être envoyé après sa numérisation. Ce document apparaît alors comme s'il avait été envoyé par courrier électronique de l'extérieur.

Ensuite s'il est possible de numériser à grande vitesse, il est difficile de transmettre le résultat de la numérisation avec des débits raisonnables sans mettre en place des technologies performantes et donc coûteuses. En effet, dans l'impression, on passe d'un format riche à un format pauvre. Le format riche est compact et peut donc être transmis rapide et son appauvrissement peut être fait facilement. Si le format transmis est déjà assez pauvre, donc volumineux naturellement, il peut être transmis sous une forme compressée dont la décompression peut être très rapide.

Par contre, le résultat d'une numérisation est une représentation pixel très pauvre et donc très volumineuse. Son traitement par reconnaissance de caractère (OCR) est hasardeux et très lent. Sa compression demande aussi des processeurs très performants pour atteindre des capacités de numérisation de l'ordre de 100 pages/minutes. L'alternative est de transmettre les documents non compressés, ce qui charge fortement le réseau et les disques.

1.35. Achat des produits bureautiques

Dans le début des années 1990, il a été particulièrement difficile de définir une architecture de produits bureautiques cohérente. Le choix de la plateforme n'était pas évident, les produits très nombreux et les utilisateurs soucieux de préserver la liberté de leur choix. Aujourd'hui, la situation a changé : la plateforme peut facilement être définie, ainsi que l'architecture générale informatique de l'entreprise. Le nombre de produits pour remplir une fonction s'est réduit et les produits qui ont un avenir (au moins à 3 ans) peuvent être facilement définis. Et finalement, les utilisateurs ont pris conscience qu'ils formaient une communauté dans laquelle les choix de l'un étaient fortement contraints par le choix de l'autre.

Acheter des produits bureautiques (ou plus généralement informatiques), c'est un peu comme acheter un puzzle, mais pièce par pièce chez des fournisseurs différents, en essayant qu'a chaque moment l'image globale du puzzle garde une signification. Parfois, il y a plusieurs fournisseurs qui peuvent fournir la pièce suivante mais souvent il y en a peu parce que les choix futurs sont contraints par les choix passés. L'émergence d'un standard (de jure ou de facto) réellement utilisés par les produits est toujours une bénédiction parce qu'elle permet de découpler les choix ; elles correspondent en fait à une standardisation des formes de certaines pièces du puzzle.

126

Aujourd'hui, il est accepté par tous que l'entreprise doit absolument unifier au moins sa plateforme, ses choix de traitement de texte, de tableur, de logiciel de dessin et de logiciel de présentation. L'unification de la plateforme est nécessaire pour rendre la gestion de la bureautique faisable. L'unification du traitement de texte, du tableur et du logiciel de dessin est nécessaire au moins pour pouvoir créer des documents composés par différents auteurs. Cette unification permet aussi de créer des archives de morceaux de documents standards réutilisables facilement (tels des clauses contractuelles ou des tableurs calculant des amortissements). L'unification de ces systèmes permet aussi de créer plus facilement des systèmes d'information créant des documents ou de façon plus générale interagissant avec des outils bureautiques. Actuellement l'ensemble des choix bureautiques sera fait sur base de 'suite' plutôt que de produits individuels. L'unification des logiciels de présentation, elle, est nécessaire ne fusse parce qu'il est nécessaire que le 'run-time' soient disponibles de façon standard sur les machines de présentation.

Il peut être impossible pour une entreprise de se standardiser à court terme sur un seul produit dans une entreprise, à cause de la présence de 2 produits dominants. C'est souvent le cas quand l'entreprise résulte de la fusion de plusieurs entreprises. Lorsqu'une entreprise est dans ce cas, elle essaiera de se standardiser sur des descriptions moins contraignantes c-à-d plus pauvres. Par exemple, au lieu de choisir un format révisable, une entreprise va se standardiser sur un format non révisable tel Acrobat ou Postscript.

En général, les entreprises harmonisent aussi le reste de leur infrastructure ; elles vont définir un type de langage de contrôle d'imprimantes, elles vont définir une architecture de réseau local et de serveur. Elles choisiront aussi un seul logiciel de base de donnée relationnel. Tous ces choix ne sont en général pas pris sur base de critères techniques souvent peu discriminants mais sur base de critères plus stratégiques tel que la robustesse du fournisseur, la compatibilité mutuelle entre les produits, la réputation du fournisseur et de son produit, le support qu'il peut offrir et le partenariat que l'entreprise et le fournisseur peuvent déjà avoir. Même le prix n'est pas normalement un critère discriminant, des produits similaires étant généralement offerts à des prix voisins et le prix final dépendant plus de la capacité de la firme à négocier vu sa taille ou son statut (agence gouvernementale, université).

Même si une entreprise effectue un choix à un moment donné, il est important de mettre sur pied une structure permettant à ces choix d'évoluer. Selon la taille de l'entreprise, cette structure sera plus ou moins lourde. La technique de création de telles structures n'est pas propre à la bureautique. Elle devrait être similaire à celle utilisée pour établir les autres grands choix stratégiques de l'entreprise. Elle variera fortement d'une entreprise à l'autre selon la 'culture' de l'entreprise.

127

En général, l'objectif consiste à trouver un juste équilibre entre l'expression des préférences des utilisateurs et la nécessité de choix communs. D'une part, il sera nécessaire que toutes les décisions importantes ayant un impact important en terme de ressources (achat, personnel, formation) soient formellement approuvées par un comité directeur composé des dirigeants de l'entreprise (en général des non-informaticiens). La préparation de ces décisions sera faite par une série de comités plus ou moins nombreux selon la taille de l'entreprise et regroupant à la fois des représentants des services informatiques et des utilisateurs (ou des informaticiens 'départementaux' agissant au nom des utilisateurs finaux). Les comités de base devront comprendre au moins des utilisateurs finaux. Souvent, il est sage aussi d'intégrer dans ces structures les représentants du personnel afin que le cadre stratégique dans lequel s'inscrit le choix de nouveaux produits soit clair pour tous.

Le comité directeur définit aussi les règles à suivre par les différents utilisateurs. Certaines entreprises, à juste titre effrayées par les dégâts qui peuvent être provoqués par des virus informatiques ont par exemple édicté des règles très strictes allant jusqu'au renvoi pour faute grave de tout employé non mandaté installant lui-même un logiciel sur son PC.

Le choix des produits peut être officialisé par une liste de produits où se trouve chaque produit accompagné d'un statut tel que 'en évaluation', 'en cours de déploiement', 'produit standard' ou 'produit en cours de déclassement' et éventuellement de certaines restrictions d'usage.

La situation est plus difficile pour les administrations où des directives européennes imposent des contraintes destinées à favoriser l'ouverture des marchés. Ces directives ne tiennent pas nécessairement compte des contraintes de l'existant et de la vitesse d'évolution d'un marché aussi dynamique.

1.36. L'organisation de la bureautique

Dans une grande entreprise, le service bureautique aura nécessairement plusieurs types de fonctions :

Une fonction d'architecte. Le service bureautique va organiser l'ensemble du service et énoncer les grandes règles d'assemblage des différentes pièces du puzzle bureautique.

Une fonction de conseil dans le choix de la sélection et de l'évolution des produits. Le service bureautique devra valoriser le coût de l'introduction d'un nouveau produit ou d'une évolution d'un produit existant et proposer le calendrier de la mise en opération.

Une fonction de paramétrisation des produits ; fourniture de feuille de style pour les traitements de texte, écriture de système d'installation automatique, création des fichiers d'initialisation, 'bridage' de certains produits pour éviter l'utilisation de certaines fonctionnalités ou de certains produits périphériques accompagnant.

Une fonction de préparation de la mise en production de nouveaux produits ou de nouvelles versions. Information des utilisateurs finaux, organisation et préparation des cours, définition avec les utilisateurs des premiers 'pilotes' etc... Cette fonction ira jusqu'à l'installation chez l'utilisateur des versions nécessaires. Cette installation se fera normalement par des procédures automatiques.

128

Une fonction de gestion au jour le jour et de support opérationnel (help desk, diagnostic de problèmes).

La multiplicité de ces fonctions montre qu'il est souhaitable de structurer souvent l'équipe bureautique dans les grosses entreprises selon 2 axes :

Une fonction centrale en charge de la sélection des produits et de fonctions de 2ème niveau en matière de conseil, de formation ou de support.

Une fonction départementale visant surtout à assurer la gestion et le support opérationnel.

On assiste cependant à une prise en charge de plus en plus grande de la gestion et du support par la fonction centrale, de façon à obtenir une rationalisation dans un contexte de compression des coûts de la bureautique.

1.37. La gestion financière

1.37.1. Les coûts bureautiques

Formellement, la bureautique ne coûte pas cher. Il suffit de placer les logiciels bureautiques adéquats sur les PC et les serveurs disponibles dans l'entreprise.

En pratique, il en va tout autrement. L'extension du parc PC, le dimensionnement des réseaux et celui des serveurs est directement la conséquence des besoins bureautiques. Il est donc important de considérer au moins une partie de ces coûts comme une conséquence directe du développement de la bureautique de l'entreprise.

Les coûts mentionnés ci-dessous sont des coûts approximatifs, calculés en EURO (€). Ils sont calculés sur une base annuelle en tenant compte de la durée d'amortissement du matériel et sont évalués hors T.V.A.

1.37.2. Coût en matériel

Les premiers coûts sont les coûts de réseau. Ceux-ci dépendent fortement de la technologie utilisée, de la taille de l'entreprise et de sa dispersion géographique. Pour une entreprise de petite taille, disposée sur un seul site, le coût d'installation d'une prise peut être assez bas, de l'ordre de 50 à 100 € par prise. Pour des situations complexes, ce coût peut être 10 fois plus élevé, de l'ordre de 500 € par prise. Une bonne moyenne est de prendre 300 € par poste. Ce coût comprend le câblage et les éléments actifs : commutateurs, répétiteurs, routeurs. Actuellement la tendance est de revenir à une topologie en étoile et le câblage est identique au câblage téléphonique. A ce coût de 500 € par prise, il faut ajouter 5% de maintenance soit 25 € par an après l'année initiale de garantie. Il faut aussi ajouter un coefficient multiplicatif tenant compte du fait qu'un poste nécessite environ une prise et demi.

En tenant compte d'un amortissement sur 5 ans, le coût par poste et par an est de

((500 + (4 x 25)) x 1,5) / 5,

129

soit 180 €/an et par poste.

Autre investissement en matériel, les serveurs "back-end". Ces serveurs servent à archiver les documents et comme serveur de courrier électronique. Actuellement un serveur NT, capable de servir 100 personnes coûte environ 20.000 à 30.000 €, en y incluant une garantie pendant sa durée de vie de 4 ans. Bien entendu, un tel serveur ne travaille pas en clustering, ce qui en augmenterait le coût. Le coût par poste et par an en terme de serveur "back-end" est donc, en prenant un coût par serveur de 24.000 €, de

(24.000 / 100)/4,

soit environ 60 €/an et par poste.

Pour terminer avec les équipements partagés, il faut mentionner les imprimantes. Au niveau personnel, et pour un usage domestique, on trouve des imprimantes pour des prix aussi bas que 250. Ce prix se compare avec le prix d'environ 1250 € d'une imprimante réseau partageable par 5 personnes, beaucoup plus rapide et beaucoup moins chère en terme de consommables (encre ou toner). Bien entendu, une imprimante partagée sera noir et blanc. Une imprimante couleur sera plutôt une imprimante type 'desk-jet', donc plutôt personnelle mais le coût actuel des cartouche d'encre est tel que le prix d'achat de bon nombre d'imprimantes est égal au prix de 6 à 8 cartouches d'encre où chaque cartouche peut faire une cinquantaine de dessin de type A4. Il faudra donc encore que le coût de la couleur baisse significativement pour que celle-ci s'introduise significativement au sein de l'entreprise. Sur une base de 1250 € comme coût d'acquisition d'une imprimante capable de servir 5 personnes, pour une période d'amortissement de 5 ans, le coût sera de

(1250 / 5)/5


Comme équipement personnel, il faut considérer essentiellement le PC. Avec une garantie de 4 ans, un PC capable d'être utilisé pendant 4 ans coûte entre 1800 € et 2000 € par PC. Ce coût est une constante depuis 10 ans. On peut bien entendu trouver des PCs deux fois moins chers, mais dans ce cas, il est plus que probable qu'il devront être remplacés dans les 2 ans... Aussi, en prenant le prix minimum de 1800 € par PC a-t-on encore un coût de

(1800 / 4)


Les coûts mentionnés ne comprennent pas le logiciel. Ceux-ci peuvent être estimés à environ 200 € par poste et par an. Ils peuvent être achetés et 'upgradé' régulièrement par achat de nouvelle version ou faire l'objet d'un contrat d'achat avec maintenance. Dans ce cas, le montant de la maintenance (donnant droit automatiquement à de nouvelles versions) peut avoisiner les 30%, donnant une idée claire de la longévité attendue de chaque version.

Le tableau ci-dessous résume les coûts en matériel

130

Type d'équipement Coût

Réseau 180

Serveur 60

Imprimantes 50

PC 450

Logiciels 200

TOTAL 940

Ce total ne comprend pas le scanner dont le prix dépend fortement de la vitesse de numérisation. Un scanner de très haute vitesse peut coûter jusqu'à 30.000 € aujourd'hui et servir entre 100 et 200 personnes, ce qui donne un coût de 200 € par personne pour une durée d'amortissement de 4 ans, soit 50 € par personne. Il existe bien sûr des scanners individuel, coûtant de l'ordre de 100 € par pièce, mais ces machines ne se justifient que pour des volumes très faibles

On peut y ajouter le coût des télécopieurs, aussi très variable, de l'ordre de 50 € par personnes et par an (sur base d'un télécopieur par 10 personnes) et le coût des photocopieurs, qui, avec l'entretien et les consommables peut coûter au alentour de 200 € par personne et par an (sur base d'un photocopieur de capacité moyenne (35 pages/minutes) par 25 personnes.

Enfin, pour des petits matériels et du matériel oublié dans cette liste, on peut ajouter 10 à 50 € par poste. A noter par exemple que l'introduction des techniques d'Intranet amène les sociétés à multiplier les serveurs "back-end".

1.37.3. Ressources humaines

Les coûts des ressources humaines ont été évalués en prenant le coût d'un prestataire de service. Le coût de personnel interne est moindre mais le coût global doit comprendre non seulement le salaire de la personne mais aussi celui de sa hiérarchie et des personnes qui l'assistent ainsi que les coûts d'infrastructure (bureau, bureautique etc...) que l'entreprise met à sa disposition. Pour ces raisons, il est préférable de prendre le coût des sous-traitants.

Les ressources humaines se classent en 3 catégories:

Gestionnaires "back-end" pour les serveurs et les réseaux.

Support de l'utilisateur final.

Formation.

En matière de gestionnaires réseau, on estime qu'il faut un gestionnaire par 1000 utilisateurs, soit à 400 €/jour et 220 jours/an, 88.000 € pour 1000 usagers ou encore 88 € par poste et par an.

131

Il faut aussi un gestionnaire de courrier par 1000 utilisateurs, soit 88 € par poste et par an.

Enfin, il faut un gestionnaire de serveur par 500 utilisateurs, ce qui donne un coût double d'environ 176 € par poste et par an.

En matière de support à l'utilisateur, on estime qu'il faut une personne par 100 utilisateurs, mais son profil est moins technique et son coût par jour pourrait être plus proche des 300 €/jour, soit 66.000 €/an ou encore 660 € par utilisateur. On voit donc que ce support est extrêmement coûteux. Il est aussi indispensable. En son absence, les utilisateurs ont tendance à s'entre-aider, ce qui donne des coûts deux à trois fois plus élevés en terme de productivité...

Enfin, en terme de formation, on estime qu'une journée de formation par an est un minimum pour maintenir l'utilisateur à niveau de son utilisation de la bureautique. Cela se traduit par un coût de 50 € par personne et par an, basé sur un coût horaire de 400 €/jour et des classes de 8 personnes.

Le tableau ci-dessous montre le coût annuel par personne

Activité Coût

Gestion réseau 88

Gestion courrier 88

Gestion serveur 176

Support 660

Formation 50

TOTAL 1062

D'autres coûts devraient être comptés:

Coûts des concepteurs et de l'ingénierie. Il s'agit d'un groupe de personnes qui gèrent et prennent les décisions importantes. Il faut compter environ une personne par 200 personnes (pour la bureautique). A 500 €/jour, le coût annuel est de 110.000 €, soit un coût par personne de 550 €/an.

Coûts des gestionnaires des achats et des marchés. Le nombre de personnes dépend du type d'entreprise (administration, entreprise privée). On peut estimer qu'il faut une personne par 500 personnes. A 400 €/jour, le coût par personne est de 176 €/an.

Coûts de la logistique. Les coûts d'installation et de déménagement (interne) doivent être ajoutés. Ces coûts peuvent atteindre 150 € par personne et par an dans des organisations qui sont fréquemment réorganisées où la mobilité interne est importante ou qui changent souvent de bâtiments...

132

1.37.4. Total Cost of Ownership et amortissement des PC

On voit donc que le coût total par poste, appelé "total cost of ownership" d'un poste de travail est de l'ordre de 2000 € par poste et par an. Ce coût est une évaluation relativement optimiste. Des études récentes ont montré que ces coûts pouvaient aller jusqu'au double du coût indiqué, surtout si on tient compte de la perte de productivité de l'utilisateur aux prises avec des problèmes qu'il ne maîtrise pas. Ces pertes de productivité sont parfois estimées à 45 % du coût total du poste.

Un des problèmes que posent aussi les PC est la différence entre leur amortissement réel et leur amortissement financier. La plupart des équipements dans les domaines techniques perdent de leur valeur selon une courbe qui n'est pas linéaire. Ainsi, pour un particulier, acheter une voiture la transforme instantanément en voiture d'occasion à la revente et lui fait perdre une certaine valeur quel que soit le délai entre l'achat et la revente et l'usage qui en a été fait (il y a des exceptions, par exemple pour des modèles pour lequel le délai de livraison est très long). Mais passé ce premier saut, la courbe de perte de valeur d'une voiture est très régulière.

Un PC acheté permet environ 80% de sa valeur de revente en un an et sa valeur résiduelle au bout de 3 ans est nulle. Pourtant, il n'est pas acceptable pour beaucoup d'entreprises de remplacer leur PC à des rythmes trop élevés à cause des coûts de tels remplacements. Aussi assiste-t-on actuellement à la construction de solution de location avec possibilité de remplacement anticipé qui masque le coût réel du remplacement rapide des équipements. Dans toute analyse de tels schémas, il faut garder à l'esprit qu'une firme qui propose de remplacer un PC n'aura probablement aucune possibilité réelle de le revendre à un coût significatif. Le coût global du PC devra donc avoir été récupéré par la firme sur la période de location.

De façon générale, pour des équipements volatils et diffusés massivement comme les PC, les solutions de location sont à valider soigneusement avant d'être choisies. Cela est d'autant plus vrai que le passage d'une politique d'achat à une politique de location est un choix facile parce qu'il libère des crédits, mais que, bien entendu le passage d'une solution de location à une solution d'achat est ensuite pratiquement impossible parce que les crédits ne sont pas disponibles pour moderniser l'entièreté du parc en fin de période de location.

Un cas particulier intéressant similaire est celui des logiciels. Une entreprise peut acheter des licences de logiciels bureautiques et racheter un ensemble complet de licences périodiquement lorsque la version du logiciel qu'elle utilise ne convient plus aux besoins. Ces achats massifs peuvent poser des problèmes de financement bien que l'ensemble des frais occasionnés par l'achat des licences concernant un logiciel ne soit en général pas trop élevé.

133

Une autre alternative en terme de logiciel est de signer un contrat prévoyant une maintenance corrective et évolutive, c-à-d la fourniture automatique de nouvelles versions. Cette option peut être intéressante mais elle dévoile implicitement la durée de vie souhaitée par le producteur de logiciel pour une version de son produit. Ainsi un taux de maintenance de 33% par rapport au prix d'achat d'une licence signifie simplement que le vendeur estime nécessaire de remplacer son produit tous les 3 (ou 4 selon la date à laquelle doit être payée la maintenance) ans.

Parfois, des propositions de location du parc avec renouvellement vont de paire avec des propositions de sous-traitance globale (outsourcing) de l'ensemble de la gestion d'un parc PC, de son support et du support de l'environnement bureautique. Pour une entreprise, un tel outsourcing lui permet de se débarrasser de toute une série d'activités n'ont pas vraiment de rapport avec son activité de base (core business). Cela peut se traduire par des gains réels si l'activité de gestion n'était pas performante à cause de l'absence d'intérêt pour ce type d'activité chez les dirigeants de l'entreprise. En particulier, une série de coûts cachés peuvent disparaître. Cette solution globale est cependant à mettre en comparaison avec la solution d'outsourcing contrôlé où toutes les activités de gestion sont aussi outsourcée mais à des fournisseurs différents, spécialisés dans leur domaine.

Les avantages de ces deux approches sont les suivants:

L'approche d'outsourcing global simplifie la gestion et peut permettre des économies d'échelle. Elle donne cependant un pouvoir de négociation important à un seul fournisseur (qualifié de partenaire) qu'il sera difficile de contrôler ou d'améliorer les performances en cas de problèmes. De plus, ce fournisseur unique, ne maîtrisant pas tous les métiers devra en accomplir certains où il n'est pas nécessairement compétent ou les sous-traiter.

L'approche d'outsourcing sélectif est en général plus économique en terme de ressources externes parce qu'elle fait une pression importante sur les prix et conduit à traiter avec les sociétés spécialisées dans chaque domaine. Elle peut cependant être coûteuse en terme de ressources de gestion internes.

1.37.5. La facturation interne

Les services bureautiques, surtout centraux, ont les mêmes problèmes que la plupart des autres services offrant une infrastructure générale: justifier leur coûts. Ce problèmes est important dans une entreprise privée mais plus encore dans une administration où il n'y a pas de revenus et où le gain de productivité est très difficile à mesurer.

La facturation interne est un système où les crédits nécessaires pour la bureautique sont confiés, non aux services bureautiques mais aux services utilisateurs. Ceux-ci sont libres de choisir les services dont ils ont besoin et sont mêmes libres, dans certains cas, de ne pas passer par le service bureautique interne de l'entreprise lorsqu'un service doit être obtenu.

Le but de facturation est de recréer un "marché" interne permettant134

De trouver automatiquement les services qui sont nécessaires à l'entreprise grâce à l'expression "financière" de la demande.

De mettre les services internes en compétition avec les services externes de façon à garder leur dynamisme et leur productivité.

De permettre aux services centraux de "reconquérir" le marché de la bureautique décentralisée sans provoquer de discussions philosophiques ; les services centralisés peuvent "monter" un service concurrent aux services décentralisés en utilisant leur capacité d'investissements et les services décentralisés sont libres de choisir ces approches si elles sont plus économiques.

De pouvoir ajuster par feedback progressif l'allocation donnée aux services utilisateur de façon à ce que, pour chaque service, elle ne couvre que l'offre à coût minimal.

Il faut cependant noter que les approches de facturation interne peuvent aussi donner lieu à des distorsions rendant leur utilisation difficile:

Certains services facturant internes bénéficient souvent de subventions cachées. Une partie de leur coût, par exemple en personnel ou en infrastructure ne leur sont pas facturé et les services centraux peuvent donc se présenter pour plus efficaces qu'ils ne sont.

Dans des environnements où il n'y a pas de revenus (administrations), certains services peuvent souhaiter utiliser des approches plus coûteuses pour des raisons de pouvoir ou d'indépendance de décisions.

De façon plus pragmatique, certains coûts variables (redevance, coûts de déménagement, consommables) ne sont pas contrôlables et leur contrôle trop strict peut mener à des inefficacités dans d'autres domaines et des surcoûts plus que proportionnels. La variation même des coûts imputés peut donner lieu à des difficultés, surtout lorsque les crédits disponibles sont alloués de façon rigide, par exemple sur une base strictement annuelle.

Néanmoins, la facturation interne et l'appréciation des coûts selon les activités (activity based costing) est une approche intéressante permettant aux services bureautiques de justifier plus facilement le coût des services offerts.

1.38. Quelques notions concernant l'infrastructure réseaux

L'arrivée d'INTERNET et du WWW ont créé une révolution dans le monde de l'échange des documents de bureau. Bien que les concepts INTERNET aient déjà été mentionnés en d'autres points de ce livre, le présent chapitre fait une synthèse de l'état actuel du domaine.

135

Chapitre 7: Quelques précisions techniques

Le 'net' existe depuis longtemps. D'abord un réseau expérimental militaire, puis un réseau universitaire, le réseau s'est basé dès le début sur une seule approche et un seul ensemble de protocoles pour transporter l'information : TCP/IP. Un protocole est une convention entre deux points du réseaux qui dialoguent ensemble selon une convention de dialogue (si je dis cela, tu peux me répondre cela ou cela ; si tu réponds cela, moi je peux répondre cela et ainsi de suite...) et un format d'échange (la langue du dialogue).

Dans la plupart des réseaux informatiques, toute information est découpée en paquets d'une taille maximale (typiquement quelques kilobytes). Chaque paquet reçoit de l'information de gestion et notamment l'adresse de destination. Il est ensuite envoyé à travers le réseau où des 'routeurs' (des commutateurs) le commutent c-à-d le transmettent de proche en proche, de routeur en routeur jusqu'à destination. Les routeurs commutent les paquets selon une politique de 'meilleur effort'. Comme un routeur n'a aucun contrôle sur l'information qui lui arrive, il se peut qu'il devienne engorgé. Dans ce cas, il peut perdre un paquet. Chaque paquet contient aussi de l'information de contrôle qui permettent de savoir si l'information contenue dans le paquet n'est pas corrompue. Si c'est le cas, le paquet est également jeté.

Cette navigation des paquets de nœuds en nœuds, de réseaux en réseaux est contrôlée par le protocole IP (Internet Protocol). Ce protocole est très rapide, mais comme déjà signalé, il peut perdre des paquets. Cela peut ne pas être trop grave si on transmet de l'information telle que du son ou des séquences vidéo. On utilise aussi IP (ou plus exactement un protocole placé au dessus de IP appelé UDP (Universal Datagram Protocol) qui contient quelques informations supplémentaires telle qu'une adresse de procesuus) lors qu'il s'agit de diffuser à intervalle régulier une information peu importante ou qu'il sera possible d'obtenir plus tard à nouveau.

Mais en général il est important qu'aucun paquet ne se perde. Même si aucun paquet ne se perd, comme chaque paquet navigue de façon indépendante des autres paquets, il peut arriver que les paquets arrivent dans le désordre à destination. Enfin, comme le destinataire peut ne pas être capable de suivre à la destination le rythme d'émission de l'expéditeur, il faut qu'il puisse arrêter l'émetteur. Le protocole TCP (Transport Control Protocol) permet d'assurer les services nécessaires :

Il assure un service de retransmission automatique des paquets perdus. Comme il numérote les paquets, il est capable à destination de les réassembler dans l'ordre.

Grâce à un mécanisme de crédit que donne le destinataire à l'expéditeur, il permet à celui-ci d'arrêter l'expéditeur s'il ne peut pas suivre tout en permettant d'utiliser efficacement des réseaux qui ont des temps de transit assez importants (comme les réseaux satellite).

Enfin, il introduit la notion de 'connexion'. Un utilisateur ouvre une connexion au début de l'interaction et la ferme en fin de déconnexion. Plusieurs connexions peuvent être ouvertes simultanément sur une seule ligne (multiplexage).

L'avantage de TCP/IP sur ses concurrents (protocoles ISO, SNA ou autres protocoles propriétaires) est qu'il est public, pratiquement sans options (donc sans problèmes de choix arbitraires pris lors de l'implémentation) et surtout qu'il peut être utilisé sur des réseaux de vitesse très différente ou de qualité très différente.

136

Avec TCP/IP, dès le début, le réseau a supporté un protocole de transfert de fichiers (FTP), d'interaction de type terminal (TELNET) et de courrier électronique (SMTP).

1.39. Les protocoles "peer to peer", "client-serveur" et réplication

Dans les chapitres précédents, on a décrit deux grands types d'interactions entre machines :

Des interactions de serveur à serveur (interaction MTA-MTA entre 2 serveurs supportant le courrier électronique, échange entre deux serveurs d'archivage pour s'échanger la liste des documents que chacun possède). Il s'agit (au moins au niveau conceptuel) d'interaction entre égaux (peer-to-peer). L'échange peut être très contrôlé, de façon à éviter qu'un serveur de document qui échange des informations avec un serveur "voisin" quant aux documents que chacun détient, ne reçoive des documents qui ne l'intéressent pas ou qui n'ont pas le niveau d'authenticité ou de protection nécessaire. Un cas particulier d'application des approches "peer-to-peer" sont les approches utilisées dans les systèmes de réplication.

Des interactions client-serveur où une station de travail demande un service à un serveur (de courrier électronique ou d'archivage par exemple) tel que l'envoi de tout ou d'une partie d'un document. L'interaction est tout à fait asymétrique, le serveur étant assez passif et se contentant de répondre aux demandes qui lui sont faites. On distingue 2 sortes de client-serveur :

– Des clients-serveurs sans état (stateless). Dans de tels clients-serveurs, le client effectue une demande au serveur, celui-ci y répond et ensuite oublie tout de l'interaction. Des clients-serveurs tels que NFS, un système de serveur de fichiers ou HTTP, le protocole du WWW sont construits de la sorte. Ils ont l'avantage de donner lieu à des serveurs très faciles à construire et très efficaces. Ces serveurs supposent cependant que le client garde l'état et dans certain cas cela peut conduire à une certaine perte d'efficacité (ainsi si un serveur permet de rechercher des documents selon une recherche 'full text', lorsqu'on rajoute un critère à une recherche qui a déjà été effectuées précédemment, un serveur sans état doit réexécuter toute la recherche. Un serveur avec état pourra se baser sur le résultat de la recherche précédente et éliminer les documents qui ne satisfont pas le nouveau critère). Mais surtout une telle technique n'est possible que si le délai pour accéder au premier bit d'information est petit par rapport au temps nécessaire pour échanger l'information. Elle ne s'applique donc qu'à des structures de communication qui ont un délai de transmission du premier bit faible (c'est le cas de NFS qui se contente utilise des protocoles 'connexion-less' sur réseau local ayant très peu de délai pour transmettre le premier bit) ou lorsque l'interaction entre le client et le serveur conduit à un échange important d'information (c'est le cas de HTTP1 ou le résultat d'une requête est la transmission d'un document complet ce qui peut prendre un certain temps voire un temps certain)...

1 Pour être tout à fait précis HTTP, le protocole du WEB utilise une approche avec état pour demander un document et le recevoir. Mais le serveur ne garde aucune trace des demandes successives pour obtenir des documents successifs au cours de la navigation.

137

– Les échanges avec état (state oriented). Dans ce mode d'interaction, le client prévient le serveur qu'il va effectuer une série de transactions (une transaction est une suite d'échanges de type 'demande'-'réponse') en ouvrant une session. Il effectue ces transactions et après exécution de celles-ci, il signale au serveur qu'il termine son travail en clôturant sa session. Un tel mode se prête bien à une série de transactions courtes ne conduisant chaque fois qu'à l'échange d'une petite quantité d'information avec des délais de réponse très courts mais où la durée de la session peut être très longue (plusieurs minutes voire plusieurs heures). C'est le cas des protocoles d'interaction avec les bases de données relationnelles où la base garde la mémoire de l'une série d'ordres consécutifs.

On notera qu'étant une technique asymétrique, l'interaction client-serveur conduit à implémenter dans le client et le serveur des fonctions tout à fait différentes. La règle d'or pour répartir les fonctions est que les fonctions doivent être proches des 'objets' qu'elles manipulent. Ainsi l'interaction entre une station de travail d'un utilisateur et un serveur d'archivage, toutes les fonctions liées à l'affichage seront localisées sur la station de travail et toutes les fonctions liées au stockage doivent être localisées sur le serveur. Cela inclut bien entendu toutes les fonctions de recherche de l'information et toutes les fonctions de contrôle d'accès au document.

La distribution des fonctions entre des machines différentes peut être plus poussée que dans une division binaire entre 'client' et 'serveur'. On arrive alors à des approches objets encore appelées approches à composants) où une multitude de fonctions couplées fortement à des données sont disponibles sur le réseau et peuvent être appelées selon les besoins.

On voit donc que les approches 'client-serveur' et les approches 'à réplication' sont basées sur des philosophies différentes:

L'approche client-serveur est une approche par spécialisation. Seul le serveur peut faire certaines choses et la clé de l'approche est de veiller à ce que dans tous les cas (utilisateurs mobiles, lignes lentes et...), le client ait accès au service.

L'approche client-serveur est une approche par banalisation. Tous les intervenants possèdent pratiquement les mêmes capacités fonctionnelles (ils peuvent tous par exemple archiver des documents, comporter des boîtes aux lettres etc...). Mais certains traitent un grand volume d'information (les systèmes d'infrastructure généraux) alors que d'autres ne traitent que les informations spécifiques à un utilisateur (les informations que l'utilisateur veut sur son portable). Les protocoles peer-to-peer assurent la synchronisation et la circulation de l'information.

1.40. Les approches objet

Les approches objets sont maintenant bien connues. Le principe de l'approche objet est que qu'il existe une relation hiérarchique entre les définitions des classes (les structures dans les terminologies plus anciennes) et que toutes les définitions de fonctions sont définies par rapport à une de ces classes (une de ces structures). La définition hiérarchiques des classes permet 2 choses importantes :

138

D'une part, les variables d'une classe seront la somme de celles propres à la classe et de celles propres aux classes dont la classe hérite (en terminologie 'classique' de type PASCAL, une classe sera un 'RECORD', une instance sera une variable de type 'RECORD', les variables de la classe seront les éléments du RECORD et l'héritance sera simplement le fait de définir un RECORD (une classe) en fonction d'un autre RECORD (la classe dont elle hérite) étendu par une construction de type 'CASE' (record variable)).

D'autre part, l'adresse d'une fonction cesse d'être une adresse absolue définie directement chez l'appelant. L'adresse qu'a l'appelant est juste une adresse relative par rapport à l'adresse de l'objet (dont la classe supporte la définition de la fonction directement ou par héritance). Cette adresse relative est initialisée lors de la création (l'instanciation) de l'objet de façon à pointer vers l'adresse réelle de la fonction à appeler. La puissance de l'approche objet provient donc du fait que c'est l'appelé en définitive qui choisit la fonction qui va réellement être utilisée par l'appelant. Ce mécanisme permet même de créer des fonctions virtuelles qui sont définies dans une classe mais implémentées uniquement dans les sous classes. En définissant des fonctions virtuelles pour certaines classes, il est possible de permettre à un appelant d'appeler ces fonctions sans savoir comment sera effectivement implémenté cette fonction. En général, ces fonctions virtuelles seront implémentées différemment par des objets qui appartiennent à des sous-classes différentes de la classe définissant la fonction.

L'héritance et les fonctions virtuelles permettent une unification des API. En effet, en l'absence de tels mécanismes, lorsque 2 implémenteurs veulent définir des fonctions similaires pour des objets de type (de classe) différents, ils vont probablement définir 2 appels de procédure (ou 2 appels de fonction) différents. Si les 2 classes d'objets sont filles d'une même classe mère et si la fonction à implémenter dans les 2 objets est définie comme fonction virtuelle dans la classe mère, alors les 2 objets resteront maître de l'implémentation de la fonction mais celle-ci offrira un API qui sera identique dans les 2 cas et sera défini dans la classe mère.

Dans le monde objet cependant, il faut distinguer soigneusement entre les langages orientés objet qui sont juste des facilités de programmation et les approches d'intégration orientées objets. Dans les approches d'intégration orientées objet, ce qui est important c'est que le lien entre appelant et appelé soit dynamique et qu'il soit donc possible de remplacer un objet par un autre sans nécessiter de modification chez l'appelant. Les techniques utilisées s'appuient donc souvent aussi sur des librairies dynamiques (DLL).

Il faut aussi souligner que l'approche objet s'est développée un peu indépendamment des autres approches 'classiques' informatiques et qu'elle a développé un jargon qui lui est propre et est souvent redondant avec d'autres termes utilisés couramment. Ainsi ce qui caractérise l'approche objet est bien souvent défini comme "l'encapsulation", "l'héritance" et "le polymorphisme". On parle de "classe","d'instances", de "méthodes" et d'"héritance multiples". Si l'on cherche à savoir ce qui se cache vraiment derrière ces termes, on peut dire ceci :

139

Les classes sont très proches des types 'structure' des anciens langages de programmation ('RECORD' Pascal ou 'struct' en 'C') . Les instances ne sont autres que les variables qui correspondent à ces types. Dans la terminologie objet, une variable est en fait un élément de la structure. La grande différence entre les classes et les types est d'une part qu'une classe peut être définie comme une extension d'une classe existante (c'est l'héritance), d'autre part qu'aux classes on associe des fonctions qui recevront implicitement comme argument une instance de la classe (c-à-d en langage classique une variable dont le type est la structure). Ces fonctions attachées à une classe sont appelées dans le jargon des 'méthodes' et comme cela a été dit antérieurement, le grand intéret de l'approche objet est de pouvoir définir les fonctions générales dans des classes générales même si leur implémentation est définie (ou redéfinie) dans des classes filles des classes générales. Dans beaucoup de langage orienté objet, 2 fonctions peuvent avoir le même nom pour autant qu'elles aient au moins un paramètre de type différent. La conjonction du nom de la fonction et de ses paramètres est appelée la "signature" de la méthode. Souvent aussi, une classe peut ajouter des paramètres à une méthode héritée d'un de ses ancêtres. Une méthode peut être 'interne' à un objet (c-à-d ne pouvoir être appelée que par une autre méthode de l'objet) ou être 'externe' à l'objet (c-à-d être appelable au départ d'un autre objet). Dans ce cas, on dit que la méthode fait partie de l'interface de l'objet. Outre des méthodes, une telle interface peut aussi contenir des variables qui sont visibles de l'extérieur.

L'encapsulation n'est autre que la technique d'isolation des modules, bien comprises depuis longtemps dans les approches structurées. L'encapsulation interdit qu'un objet n'accède directement aux variables d'un autre objet. L'accès doit se faire via une fonction (une méthode). Selon les langages et les philosophies objet, cette restriction est plus ou moins forte. Son application absolue pose en effet des problèmes importants lorsqu'un certain nombre d'objets doivent collaborer étroitement. Aussi, place-t-on éventuellement certaines des variables de l'objet dans l'interface de l'objet de façon à ce que ces variables soient accessibles de l'extérieur de l'objet. Il y a souvent aussi des mécanismes spéciaux qui permettent dans certains cas à un objet d'accéder de façon directe à l'intérieur d'un autre objet. Enfin, il faut définir les droit d'accès d'une classe par rapport à la classe mère. En particulier, il faut définir si les variables de la classe mère sont directement accessibles à la classe fille.

140

Une classe peut être l'héritière de plus d'une classe. Ainsi une classe d'objet représentant un 'cheval' peut-elle hériter d'une classe 'moyen de transport' et d'une classe 'animal'. Plus bureautiquement parlant, un autre exemple d'héritance multiple sera le cas du formulaire de déclaration de frais qui pourra appartenir à la fois à la classe des formulaires et à la classe des documents financiers. L'héritance multiple devrait être quelque chose de largement utilisé parce qu'un objet peut souvent être vu sous plusieurs angles correspondant à autant de classe. Malheureusement, la plupart des langages orientés objet placent des restrictions importantes sur l'héritance multiple, principalement à cause des problèmes d'implémentation. En effet l'accès physique aux variables d'instance et aux fonctions d'un objet se fait de façon relative par rapport à l'adresse de l'instance de l'objet. Dans le cas d'héritance multiple, il est nécessaire de rajouter une constante (un offset) pour au moins les variables d'instance et les fonctions provenant d'une des classes. De plus se pose le problème des conflits potentiels de noms entre des fonctions ou des variables différentes dans les 2 classes mais portant le même nom. Il y a aussi le problème de savoir que faire lorsque les 2 classes dont on hérite possèdent un ancêtre commun: comment identifier et traiter les variables et les fonctions qui proviennent de cet ancêtre commun. Une façon de traiter l'héritance multiple est de définir une notion intermédiaire entre l'objet et ses méthodes ou ses variables. Cette notion sera par exemple la notion "d'interface" au sens OLE. Un objet comprendra une ou plusieurs interfaces, résultat de sa chaîne d'héritance. Ces interfaces définiront les fonctions supportées par l'objet du fait de son héritance ainsi que les fonctions propres de l'objet. En général de telles "interfaces" supportent des fonctions mais par nécessairement des variables.

Le polymorphisme est un cas particulier d'héritance multiple. Certaines fonctions ont par habitude une représentation particulière telle l'addition qui, au lieu de l'appeler 'f_add' se représente habituellement par un opérateur '+'. Très souvent, on veut utiliser le même opérateur sur des 'objets élémentaires' différents. '+' permettra d'additionner des nombre, d'additionner des matrices, de concaténer des chaînes de caractère etc... Il sera même possible d'utiliser '+' entre 2 objets défini dans l'application. Cette 'surcharge' (overloading) de l'opérateur '+' est la manifestation du polymorphisme. Il est facile de voir que logiquement, le fait que '+' (ou la fonction f_add) s'applique à la fois aux entiers et aux chaînes de carctères n'est que la manifestation du fait que ceux-ci appartiennent à la même classe. Cette classe est cependant très générale et c'est pour cela (et à cause des restrictions sur l'héritance multiple) que souvent le polymorphisme est défini comme un concept séparé.

1.41. Les techniques de base d'intégration du monde windows

Pour permettre l'intégration entre différentes applications bureautiques, différentes techniques sont utilisées. La première technique est celle des librairies dynamiques ou DLL. Dans les langages de programmation classiques, il existe des librairies qui groupent une série de procédures. En général, ces procédures permettent de contrôler l'accès à l'ensemble des objets implémentés dans la librairie. Les librairies classiques sont utiles pour les programmeurs parce qu'elles permettent lors du développement d'un programme d'utiliser des modules développés de façon standard.

141

Les librairies standards ont cependant un problème important. Elles s'incorporent à un programme à l'étape de sa conception, lors de l'établissement de tous les liens conduisant à la construction d'un programme exécutable. Cela signifie que c'est le constructeur du programme qui décide quelle librairie incorporer et que cette incorporation est définitive. De plus cette méthode ne peut pas fonctionner lorsque l'on veut faire un lien entre des programmes basés sur un langage interprété et des programmes basés sur un langage compilé. En effet dans ce cas, il n'est pas possible d'effectuer un lien statique entre le programme interprété appelant et la librairie compilée appelée.

Les librairies dynamiques, permettent de créer des programmes qui appellent des sous programmes en effectuant le lien lors de l'exécution. Le programme appelant identifie le fichier contenant le sous programme et le nom du sous-programme dans le fichier. Les sous-programmes du fichier sont chargés en mémoire si ce n'est pas encore fait. La procédure appelante code ses arguments selon un format prédéfini et passe à la procédure appelée un pointeur vers la zone contenant les arguments. La procédure appelée reçoit la zone et décode les arguments. Après exécution de la procédure, le mécanisme inverse est utilisé pour retransmettre le résultat, c-à-d la mise à jour des valeurs des paramètres passés par référence.

Les librairies dynamiques permettent donc le lien entre des programmes réalisés dans un langage interprété et des librairies réalisées dans un langage compilé. Elles permettent de définir un interface à un système d'exploitation sous la forme d'appels de procédure dans un langage de haut niveau de type 'C'. La combinaison de ces 2 utilisations permet par exemple à des macros utilisées dans les langages interprétés associés aux tableurs ou aux traitements de texte d'appeler des fonctions du système d'exploitation.

Elles permettent aussi de définir des interfaces génériques tel que ODBC (Open Database Connectivity) permettant l'accès à des bases de données. L'implémentation de cette librairie sera faite par chaque vendeur de produit (ici chaque vendeur de base de donnée). Les programmes qui utilisent l'interface peuvent être construit indépendamment de l'implémentation de l'interface.

Similaire aux librairies dynamiques, on trouve les appels de procédures à distance (en Anglais 'Remote Procedure Call: RPC). Ces RPC sont à la base de toutes les implémentations des approches 'client-serveur' décrites ci-dessus. Comme dans les DLL, l'appelant d'une RPC encode dans une mémoire la valeur des arguments selon une syntaxe fixée ainsi que le nom de la procédure appelée. Au lieu de fournir un pointeur vers la zone comme dans le cas de DLL, la procédure appelante encode les valeurs des arguments de façon à pouvoir les passer dans un système de communication. A la réception, la procédure appelée est choisie en fonction du nom de procédure passé par le moyen de communication. Cette procédure effectue une désérialisation des arguments reçus du système de télécommunication et reconstitue l'image de la mémoire d'argument. Elle s'exécute en utilisant les arguments et fournit en retour la valeur des arguments en sortie (ou définit comme étant transmis par référence). Ceux-ci sont placés dans une zone mémoire, réencodé sur le réseau, désérialisés par l'appelant et utilisés par celui-ci pour effectuer la suite de son travail.

142

L'avantage des RPC est donc de permettre des appels de procédures à distance, c-à-d localisés sur une autre machine. Bien entendu dans des cas simples, la machine qui contient les procédures appelées peut être identifiée statiquement. A l'avenir, des systèmes de répertoire doivent permettre la localisation dynamique des procédures sur les différentes machines.

Les approches client-serveur ne sont que l'application des RPC pour créer des systèmes standards de procédures permettant de manipuler un certain type d'objet. Ainsi un serveur de fichier offrira une série de procédures permettant de manipuler des fichiers de façon à les ouvrir, en lire ou écrire le contenu ou les fermer. Un serveur de base de donnée permettra de manipuler les objets gérés par le système de base de donnée. Dans le cas d'une base de donnée de type relationnel, les objets gérés par la base de données sont des tables relationnelles et le système permettra de sélectionner les lignes d'une table ou d'insérer, détruire ou modifier des lignes. Dans le cas d'une base de donnée documentaire, l'objet manipulé sera le document et le serveur offrira des fonctions permettant de stocker un document, de retrouver toutes les identifications des documents satisfaisant à certains critères ou de rapatrier les documents identifiés par un identificateur unique. Il est aussi possible de créer des serveurs de présentation qui offriront des services d'affichage d'information. Enfin, il est aussi possible de construire des serveurs spécifiques à une application tel qu'un serveur de compte bancaire (dans le cas d'une banque) qui offrira les opérations classiques de versement sur un compte, retrait d'un compte ou virement de compte à compte.

Les techniques telles que les DLL ou les clients-serveurs préfigurent en fait les approches objets. En effet dans une DLL, la procédure ou la fonction appelée est identifiée par rapport à un fichier contenant un ensemble de telles procédures et de fonctions. Le fichier définit en fait l'objet manipulé et les procédures et les fonctions peuvent être assimilés aux méthodes des approches objet. De façon similaire, l'identification d'un serveur identifie un objet qui sera manipulé à distance et les RPC peuvent-elles aussi être assimilées aux méthodes des approches objets. Ce qui manque aux DLL et aux RPC, c'est l'héritance et parfois aussi, la gestion interne d'un état propre à l'objet (dans le cas de client-serveur 'sans état' (stateless)).

Les DLL et les RPC ont aussi en commun avec les systèmes à événement décrits ci-dessous d'être entièrement tournés vers l'extérieur c-à-d vers la satisfaction de requêtes provenant de l'extérieur et donc de gérer leur état (s'il y en a un) explicitement et non implicitement comme dans un programme classique.

La plupart des systèmes de fenêtrage sont bâtis sur un système général à événement. Un événement est associé à un objet (par exemple une fenêtre ou un bouton) et signale à l'extérieur un changement de son état interne. Il transporte peu d'information (c'est une sorte d'appel de fonction sans paramètre ou plus exactement avec seulement quelques paramètres prédéfinis) et il n'a pas pour but de demander directement l'accomplissement d'une action précise.

143

Un événement est généré par un objet vers un client qui a précisé antérieurement à l'objet que certains événements d'un certain type l'intéressait. Lorsque l'événement se produit, l'objet appelle son client pour lui notifier l'événement. Cet appel est souvent nommé dans la littérature un 'Call Back'. Le client peut ne pas réagir lorsqu'un événement lui est notifié ou se contenter de signaler l'événement à un autre objet, souvent plus général. Les événements peuvent donc remonter une emboîtement de classe à la recherche d'une classe décidée à les traiter. Parfois la transmission se fait selon une hiérarchie d'aggrégation et non une hiérarchie de classe.

Les systèmes à événements ont été largement utilisés dans la construction des interfaces utilisateurs graphiques (GUI: Graphical User Interface). Le 'clic' de l'utilisateur sur la souris positionnée a un endroit sera un événement qui pourra être jeté (en émettant le cas échéant un 'bip' sonore) ou être traité de façon variée selon l'objet (un bouton, un objet d'édition de texte etc). En fonction du traitement souhaité, des actions très complexes pourront être prises par le client qui contient l'objet.

Un programme sous un système à fenêtrage est donc essentiellement un mangeur d'événements. Il est donc possible à n'importe quel moment de lui envoyer des événements différents sans que le programme ne soit à un 'endroit de son exécution' où il est prêt à recevoir de tels événements (bien sûr un programme pourra ignorer un événement s'il estime 'que ce n'est pas le moment' ; mais cela est une action explicite et non implicite du programme). Cette propriété a rendu possible l'implémentation d'outils comme le 'presse-papier', le 'drag and drop' ou l'échange dynamique de données (DDE: Dynamic Data Exchange). De plus, comme après avoir traité un événement, le programme se repositionne toujours dans le même état, à savoir l'attente de l'événement suivant, il est relativement facile d'implémenter des systèmes multitâches simples tels que Ms-Windows 3.1.

Le 'presse-papier' permet de copier des parties d'un document dans un autre document. Le copiage se fait via une application 'presse-papier' qui va contenir la partie qui doit être échangée ou au moins une référence à cette partie. Lorsqu'un programme reçoit une demande de copiage (ou de découpe c-à-d de copiage suivi de destruction) d'un morceau de texte, il met une ou plusieurs copies de ce texte en réserve et informe le 'presse-papier' de la disponibilité de l'information en fournissant un pointeur où elle est disponible (ou un identificateur de disponibilité) et la liste des formats sous laquelle cette information est disponible. Lorsque le programme destinataire reçoit une demande de 'Collage' (Paste), il s'adresse au 'presse-papier' qui lui fournit la liste des formats supportés. Il choisit le format qui lui convient (en général le plus riche) et en avertit le 'presse-papier' en fournissant une référence à l'endroit où le collage doit être fait. Le 'presse-papier' demande à l'origine de faire le copiage dans la destination (ou effectue le copiage lui-même). L'ensemble du fonctionnement est un mélange d'appel de fonction classique et d'échange d'événement (par exemple pour informer le 'presse-papier' ou l'expéditeur que l'objet copié dans le 'presse-papier' a été demandé). Bien sûr dans les versions plus évoluées du presse-papier, ce n'est pas un simple extrait de document qui est envoyé mais bien un 'objet' encapsulé (un bloc) muni ou non de sa représentation affichable.

144

Le 'drag and drop' fonctionne de façon similaire. La différence est que le drag and drop prend un objet d'une application et l'associe (le dépose) dans un autre objet appartenant à la même application ou à une autre. Un 'feedback' visuel lors du déplacement de l'objet permet de savoir si le dépôt (le drop) est permis ou non à l'endroit où se trouve l'objet déplacé.

DDE (Dynamic Data Exchange) a été la première technique structurée d'échange d'information 'automatique' entre 2 applications. L'idée de DDE est de permettre à un destinataire d'un 'copier-coller' de demander lui-même le copiage chez l'expéditeur de l'information. Dans un lien DDE, le client DDE est le destinataire de l'information. Il demande des informations à un serveur (ou source) DDE qui en est l'expéditeur. Pendant la phase d'appel, l'information que le serveur doit fournir au client est identifié par une adresse en 3 parties:

Un nom de programme à appeler ; celui-ci doit être actif.

Un nom de "topic", souvent un nom de fichier

Un nom d'item c-à-d une localisation dans le topic. Ce sera par exemple un ensemble de cellules dans un tableur.

La liaison DDE peut être froide (cold link) si le client demande simplement de l'information et la reçoit. Une liaison tiède (warm link) permet au serveur de signaler au client un changement d'état de l'information identifiée par le programme, le 'topic' et l'item, à charge du client de redemander la retransmission de l'information. Une liaison chaude (hot link) permet au serveur de signaler un changement d'état de l'information demandée et de retransmettre au client l'information avec les nouvelles valeurs.

Les liaisons DDE sont bien sûr basées sur le système à événement de l'interface à fenêtrage. Elles possèdent toute une série de limitations qui rendent leur usage 'fiable' peu facile à mettre en oeuvre

1.42. OLE et l'approche composant sous windows

OLE (Object Linking and Embedding) est une approche globale de l'architecture des logiciels qui vise à permettre la construction d'applications sur base de composants réutilisables éventuellement disponibles sur le marché. La nécessité d'une telle approche pour développer des logiciels a d'abord été évidente en bureautique, où il est difficile d'inclure dans une seule application bureautique toutes les fonctions nécessaires. Mais il est clair que le besoin est général et s'applique à n'importe quelle construction de logiciel informatique. Seule cette approche permet de résoudre le dilemme 'faire ou acheter' (make or buy).

145

Pour atteindre cet objectif, OLE emprunte beaucoup de concept de l'approche 'objet' et notamment le fait que 2 applications qui collaborent ne doivent jamais chercher à interpréter la représentation interne de l'information de leur partenaire. Toutes les interactions doivent se faire via des appels de fonctions qui appartiennent aux interfaces supportées par les applications. OLE adapte cependant les concepts des langages orientés objets pour qu'ils soient applicables dans le monde des représentations binaires (c-à-d exécutables) et non uniquement dans le monde des représentations source. C'est ainsi que, comme cela a déjà été dit, OLE ne reprend pas la notion d'héritance 'stricto-sensu' mais reprend un notion d'interface mais puissante mais plus souple.

OLE est structuré en plusieurs couches :

La couche de base implémente les 'interfaces OLE'. Chaque application supporte une ou plusieurs interfaces, accessibles (lorsque l'application est chargée en mémoire) via un pointeur. Ce pointeur pointe vers une 'vtable', vecteur de pointeurs où chaque pointeur contient l'adresse d'une fonction à appeler. Ce mécanisme d'appel est celui utilisé par la plupart des mécanismes C++. Il permet l'héritance (simple) des 'interfaces'. En particulier, toute interface, pour être OLE doit 'hérité' (c-à-d supporter les mêmes fonctions) qu'une interface de base IUnknown qui contient 3 fonctions, permettant de connaître les autres interfaces et de gérer la destruction des instances lorsque les applications tournent. Les applications peuvent donc interagir entre elles grâce aux appels des fonctions définies par les différentes interfaces. A noter cependant qu'en pratique, l'appel direct des interfaces ne s'applique bien qu'à des programmes écrits en 'C++'. Chaque interface a un identificateur unique et un interface défini contient toujours le même nombre de fonctions avec le même nombre de paramètres.

Ces interfaces peuvent être utilisées pour commander des serveurs 'in process' (c-à-d des librairies dynamiques), des autres processus locaux situés sur la même machine, et depuis peu, des processus distants (via DCOM). Il est possible de réutiliser le code d'une interface dans un autre interface grâce à des mécanismes d'inclusion ou d'aggrégation. Dans l'inclusion, l'interface d'un objet utilise les interfaces d'un autre objet. Dans l'aggrégation, un objet expose les interfaces d'un autres objets.

Sur base de cette infrastructure de base, MICROSOFT a défini une série d'interfaces standards. Parmi ces interfaces on trouve

– IStorage ou IStream qui permettent de gérer le stockage d'information.

– IMoniker qui permet d'identifier des instances d'objets c-à-d l'équivalent des fichiers, items etc... de DDE, mais de façon plus générale.

– IDataObject qui permet d'accéder à des données d'une application en gérant le type des données, le type de stockage (mémoire, disque etc...).

– IPersistStorage, IPersistMoniker, variante de IStorage ou IMoniker interface supportée par des serveurs permettant aux clients de les commander.

– IAdviseSink qui permet à un client de recevoir des événements de son serveur.

146

– IOleClientSite qui permet à un client de recevoir des informations de son serveur (par exemple pour lui demander d'être rendu visible).

– IOleObject qui permet à un client de demander à un serveur de faire des actions et notamment d'exécuter des verbes tel que 'Open' ou 'Edit'.

– IRunnableObject qui permet de contrôler l'état du serveur (si son code est chargé par exemple).

– IOleCache2, IOleCacheControl et IViewObject2 qui permet à un container de contrôler et d'utiliser les services de production de représentation cache.

– IOleInPlaceObject et IOleInPlaceActiveObject qui implémentent l'activation 'in-place'

– ...

MICROSOFT a aussi implémenté un interface appelé IDispatch qui permet à des 'langages à scripts' d'appeler des fonctions exportées par un serveur sans avoir à gérer la complexité des vtable. Il s'agit d'un système de communication entre objets greffé au dessus du mécanismes des interfaces. Ce système est à la base de l'OLE automation. Il permet à des applications possédant des langages à script tel EXCEL ou WORD d'exporter des fonctions vers d'autres applications tel Visual Basic (ou WORD ou EXCEL).

En fait, un object 'Client OLE' est un objet qui supporte certaines interfaces. Un 'Serveur OLE' est un objet qui supporte d'autres interfaces. Un ActiveX est un serveur OLE qui supporte des interfaces supplémentaires (notamment IDispatch mais aussi ISpecifyPropertyPages qui permet d'extraire les 'propriétés' de l'ActiveX), alors qu'un conteneur de contrôle 'ActiveX' supporte certains interfaces nécessaires permettant à l'ActiveX d'obtenir des informations sur son container ou de le commander... . Bien entendu, un object peut supporter toutes les interfaces qui font de lui à la fois un container OLE, un serveur supportant l'activation sur place, un contrôle 'ActiveX'....

Par exemple un produit tel que Visual Basic ou Microsoft Explorer sont des conteneurs de contrôle ActiveX. WORD et EXCEL sont des containers et des serveurs avec 'activation sur place'....

OLE avait un concurrent aussi bien dans sa fonction purement bureautique que dans sa fonction d'outil général d'intégration. Celui-ci se nommait 'open doc'. La puissance de MICROSOFT et l'utilisation généralisée d'OLE dans de nombreux produits non MICROSOFT a pratiquement fait disparaître ce dernier. Des architectures tels que JAVA ou celle de POWERBUILDER sont cependant des concurrents important au moins dans des domaines particuliers. Le principal problème de OLE est en effet sa complexité technique et une gourmandise certaine en ressources). L'apparition de OLE Automation et la possibilité de créer des serveurs OLE avec des outils comme visual basic a cependant atténué le problème de la complexité technique.

L'architecture COM, sur laquelle s'appuie OLE a été maintenant étendue pour être utilisable entre machines différentes (DCOM).

147

Initialement OLE a été créé pour réaliser des documents basés sur des blocs utilisant chacun leurs propres éléments de base pour représenter l'information de façon riche. Par conséquent, ces blocs sont souvent éditables par des applications différentes. OLE permet à une application 'container' capable d'éditer la structure générale du document (celle qui contient les blocs, usuellement un traitement de texte) d'appeler si nécessaire les applications capables d'éditer le contenu des blocs lorsque cela s'avère nécessaire.

Lorsqu'un utilisateur décide d'inclure un bloc éditable par un autre outil (par exemple un dessin éditable par un outil tel Corel Draw) dans un document édité avec un traitement de texte (par exemple Word Pro), le container (c-à-d le traitement de texte) demande au serveur (c-à-d le logiciel de dessin) de lui fournir une représentation riche du texte et une représentation imprimable (sur écran et sur imprimante). Il stocke ces 2 informations dans le document container. Lorsqu'il doit afficher ou imprimer une partie de document qui contient le bloc éditable par le serveur (le dessin), il utilise la représentation imprimable qui lui a été fournie. Lorsque l'utilisateur doit éditer le bloc, le container démarre le serveur (s'il n'est pas déjà démarré) et lui fournit la représentation riche qu'il possédait. Le serveur édite cette représentation (dans certain cas, 'sur place' c-à-d sans que l'utilisateur ne se rende vraiment compte qu'il change d'application). Quand le serveur a fini l'édition il retransmet au container les deux représentations.

OLE est beaucoup plus riche que cette simple description. Il permet par exemple, au lieu d'inclure le bloc dans le document (embedding), d'inclure une référence au bloc dans le document (linking). Le bloc ainsi lié peut être alors partagé par plusieurs documents (voire plusieurs utilisateurs s'il est placé sur un serveur de fichier en réseau). Si un document modifie le bloc, cette modification se retrouve automatiquement dans tous les documents (et il est important de bien synchroniser les modifications si plusieurs utilisateurs ont accès simultanément au même bloc au départ de documents éventuellement différents). Pour facilier la gestion des liens, il possède une structure complexe d'identification (les moniker) qui permettent de diminuer les risques d'une rupture de la liaison.

Avec le temps, OLE a repris aussi les fonctions des composants de Visual Basic (VBX initialement, OCX dans l'environnement OLE). Cela s'est avéré intéressant dans le cas des documents WEB où la présence de boutons ou d'autres "contrôles" capables de générer des événements et de réagir à des méthodes (des appels de fonctions) permet de créer des pages dynamiques, utiles dans un monde WEB. Ce point est décrit au chapitre suivant.

1.43. Java, javascript et la complexité du monde WEB

HTML a été décrit comme une syntaxe permettant la description d'un document à un certain niveau de richesse (qui est défini implicitement par la sémantique attachée aux différentes balises).

On peut aussi considérer HTML simplement comme une syntaxe d'affichage d'information sur écran. Ainsi, une application classique, au lieu de produire ses demandes d'affichage dans l'interface programmatique WINDOWS ou Postscript, peut la générer en HTML. Le résultat sera alors mis en page par l'afficheur HTML.

148

Les premières applications de ce principe ont été les outils de recherche disponibles sur INTERNET. Ces outils de recherche permettent de retrouver les documents dont le texte (ou le titre) contient des mots clefs fournis par l'utilisateur. Ces outils permettent à l'utilisateur d'introduire une équation de recherche dans un champ. Ce champ est utilisé pour composer un URL dont la partie 'fichier' est l'équation de recherche. Cet URL est envoyé au serveur lorsque l'utilisateur presse un bouton 'SEARCH'. Du côté du serveur, cet URL (ou plus exactement sa partie 'fichier' c-à-d l'équation de recherche) est transmise à un programme de recherche qui construit dynamiquement une page HTML donnant le nombre de documents trouvés ainsi qu'une référence à ceux-ci. Le programme de recherche est dans ce cas une application tout à fait spéciale destinée uniquement à faire des recherches sur INTERNET.

Pour implémenter facilement ces outils de recherche et pour l'étendre à la construction de serveurs d'information dont certaines pages dont des documents statiques 'classiques' et d'autres sont des extractions de bases de données relationnelles ou documentaires, les développeurs de serveurs INTERNET ont défini un interface entre le 'serveur de document INTERNET' qui est capable d'afficher les documents statiques présents sous forme de fichiers et un système relationnel ou documentaire. Un tel interface tel le CGI (Common Gateway Interface) utilisé surtout en environnement UNIX ou l'interface ISAPI (Internet Server Application Programming Interface) utilisé dans le monde Windows NT, permet de faire ce lien. De telles interfaces permettent surtout de construire des formulaires complexes.

Dans ce cas, le serveur de document INTERNET affiche une page HTML qui contient une 'Form' et la définition de ses champs. La 'Form' contient aussi un bouton 'Submit' et un bouton 'Reset'. Lorsque l'utilisateur clicke sur le bouton 'Submit', l'afficheur HTML collecte les valeurs des champs et les envoie sous la forme 'Nom du champs = valeur' au serveur de documents INTERNET en les associant à un URL. Celui-ci passe alors à l'application associée à cet URL les couples de valeurs via l'interface CGI (ou une autre interface). L'application effectue ses calculs et produit en retour une page HTML qu'elle retourne via l'interface au serveur de document INTERNET. Celui-ci retourne l'information à l'utilisateur. On peut donc avoir ainsi un véritable dialogue entre l'utilisateur et une application via un afficheur WWW. Il faut cependant noter qu'à chaque interaction 'demande - réponse', la connexion TCP/IP entre l'utilisateur et le serveur de doocument est coupée. Un tel mode d'interaction ne convient donc pas pour des applications complexes demandant des transactions de longue durée entre l'utilisateur et l'application.

Avec le temps, les utilisateurs WWW ont commencé à devenir exigeants et à ne plus se contenter de la mise en page HTML. D'une part, ils ont commencé à vouloir 'afficher' des fichiers de données de formats variés et à priori inconnus (par exemple du son, des images animées, des images 3D, des formats traitement de texte natif). D'autre part, ils ont souhaité pouvoir exécuter de véritables applications en local, par exemple pour valider la cohérence des données introduites dans un formulaire.

Ces 2 problèmes sont identiques, puisque dans les 2 cas, il faut que l'utilisateur dispose d'une application spécifique destinée soit à afficher le nouveau 'type' de document, soit à effectuer le traitement local.

149

Il n'y a pas une solution, mais bien une série de solutions, selon que l'on privilégie la sécurité, la puissance, la rapidité, la portabilité, la transparence pour l'utilisateur, la réutilisation de code existant...

... et bien entendu surtout en fonction d'objectifs stratégiques des firmes intéressées à la domination du marché INTERNET.

Voici quelques possibilités :

On peut créer une 'application d'aide'. L'afficheur HTML demandera à l'utilisateur s'il veut décharger une application associée au format des données. Si l'utilisateur accepte, l'application est chargée puis lancée (via une ligne de commande classique). Elle s'exécute dans sa propre fenêtre comme une application indépendante. L'application déchargée par l'utilisateur est stockée sur le disque local.

On peut créer un 'plug in'. Introduite par NETSCAPE, cette solution revient à charger un morceau d'application qui sera liée à l'afficheur. L'information s'affiche alors directement dans l'afficheur. Le stockage est automatique (avec l'afficheur) mais le code du 'plug-in' n'est pas portable.

Un des problèmes avec des 'plug in' est qu'il est lié à l'afficheur et que son code doit être compatible avec le matériel supportant l'afficheur. Pour supprimer ces problèmes, SUN a inventé un langage appelé JAVA, assez semblable au C++, mais plus propre, indépendant du matériel et sécurisé. Un 'applet' JAVA peut être déchargé et lancé à partir d'une page HTML. Ce morceau de programme (qui correspond à une classe) est reçu sous forme d'un code intermédiaire appelé BYTECODE, à mi-chemin entre le programme source et le langage machine. Les afficheurs suppporte l'interprétation de ce BYTECODE. Le langage JAVA est défini de façon à éviter toute interaction directe avec la mémoire physique ou le système de fichier (de façon à éviter les virus). Il est très 'propre', plus facile à utiliser que le 'C' ou le 'C++' (il n'a pas de pointeurs et gère complètement la mémoire) et est multi-thread (plusieurs exécutions en parallèle) ; il permet donc des animations. Ses principaux inconvénients sont d'être un nouveau langage, d'être interprété partiellement (et donc d'être plus lent) et d'être parfois trop isolé de la machine de l'utilisateur. Par contre, étant un langage de programmation, JAVA peut servir à écrire des programmes indépendants de tout afficheur. Il est donc possible de créer des applications pouvant à la fois être indépendantes et utilisables à partir d'un afficheur WWW standard.

JAVA a pour inconvénient d'être un 'vrai' langage de programmation qui nécessite un investissement en temps d'un programmeur professionnel versé dans le développement orienté objet. Pour faciliter la construction de petits programmes, il est plus facile d'utiliser un langage de script. Aussi NETSCAPE a-t-il développé un langage de script dérivé de JAVA appelé JAVASCRIPT. JAVASCRIPT ne possède pas toutes les caractéristiques de JAVA. Il est directement écrit dans les pages HTML.

150

Bien entendu, faire communiquer un programme (un afficheur) avec un autre programme (le programme spécifique d'affichage ou le programme de l'utilisateur) est quelque chose d'assez courant en bureautique... Il suffit de penser à l'intégration d'un tableur avec un traitement de texte... Aussi, MICROSOFT a-t-il tout naturellement pensé à ses propres mécanismes Windows pour faire cette intégration. Dans le monde Windows, la mécanique pour intégrer 2 applications est OLE (Object Linking and Embedding) décrit au chapitre précédent. Il s'agit d'un mécanisme complexe mais très puissant de communication. En particulier, le 'croisement' de OLE et des composants Visual Basic avait donné des OCX, des composants ayant un aspect à la fois visuel et programmatique permettant de construire des applications par assemblage de composants. Ces OCX étaient donc particulièrement adaptés à l'enrichissement d'afficheurs WWW. MICROSOFT a donc rebaptisé ces composants 'ActiveX', a défini des balises HTML pour pouvoir les référencier et a inclus les mécanismes de liens dans son afficheur. Un ActiveX est donc comme un Applet JAVA (ou plus exactement un JavaBeans). Par opposition à JAVA, il dépend de la plateforme (une plateforme Windows 95 ou Windows NT). Il est aussi capable d'interagir avec les fichiers PC mais possède néanmoins des mécanismes de sécurité (plus lâches) basé sur des techniques de signature de logiciel. Un ActiveX peut être écrit en C++ ou avec d'autres outils tels que Visual Basic.

Et puis, comme la programmation d'ActiveX est difficile, MICROSOFT permet donc aussi d'utiliser des programmes écrits dans son langage de script VBScript (Visual Basic Script ou VBS), un sous-ensemble des langages utilisés dans sa suite bureautique. Ces scripts sont aussi inclus dans les pages HTML. VBS est un concurrent à JAVASCRIPT.

Un tel foisonnement d'outil prouve que le marché d'extension HTML n'est pas mûr d'autant plus que les années récentes se sont encore enrichies en terme de possibilités d'interaction entre afficheur (browser) et serveur. Il est probable que de nombreux facteurs externes non techniques vont rationaliser le marché laissant subsister un langage de programmation pour construire des 'applets' et un langage de script.

A noter cependant que les technologies de plug-in, d'applet JAVA et d'ActiveX ne sont pas aussi incompatibles qu'elles n'en ont l'air. Il existe des enveloppeurs qui permettent d'appeler des composants d'un système à partir d'un autre.

151

Documents

examenscorriges.org · Web viewBUREAUTIQUE. Un monde centré sur le document. Ph. BERTRAND (C) V1.1.1 1998. Chapitre 1: Un objet méconnu, le papier 6. 1.1. La Bureautique en …