38
6HUYHXUGHWKqVHV HQWH[WHLQWpJUDO Rapport de Projet de Fin d’Études ,16$GH/<21²’RF•,16$ Rédaction : Marc-Etienne HUNEAU Version : 2.23 Révision : vendredi 26 juin 1998

6HUYHXU GH WKqVHV HQ WH[WH LQWpJUDO ...csidoc.insa-lyon.fr/these/doc/rapport_pfe.pdfpar rapport aux «butineurs» Internet standard (un format HTML simple, voire un Texte ASCII par

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • 6HUYHXU�GH�WKqVHVHQ�WH[WH�LQWpJUDO

    Rapport de Projet de Fin d’Études

    ,16$�GH�/

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    5HPHUFLHPHQWV

    Je tiens tout d’abord à remercier Madame Monique JOLY, responsable de Doc’INSA, qui m’aaccueilli au sein de son service et m’a permis de participer à ce projet.

    Je remercie Monsieur Jean–Marie PINON, professeur de l’INSA et enseignant responsable de monstage, pour son encadrement et ses précieux conseils.

    Je remercie particulièrement Jean–Michel MERMET, webmestre et responsable de l’interface ducatalogue informatisé de Doc’INSA (entre ses nombreuses casquettes) ; tuteur de mon stage, pourm’avoir apporté la rigueur qui me fit parfois défaut, et pour ses conseils lucides et pertinents.

    Je remercie tous les membres de l’équipe ‘thèses’ d’avoir, au fil de nos réunions de travail, planté ledécor complet de ce projet et de m’avoir ainsi apporté une vision globale sur ledit projet.

    Je remercie sincèrement tout le personnel de Doc’INSA pour sa sympathie à l’égard du nouveauvenu que j’étais dans le bureau des hommes… et pour m’avoir fait apprécier l’envers du décord’une bibliothèque.

    A l’issue de trois agréables années au sein du département informatique de l’INSA de Lyon,j’adresse des remerciements particuliers à Monsieur Yves MARTINEZ, directeur du département,pour le dynamisme de ce département d’études, à Jacqueline MARTINEZ et Odile CLEMENT pourleur gentillesse et leur efficacité, et à toute l’équipe enseignante pour la qualité de l'enseignementqui nous a été dispensé.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    6RPPDLUH

    1 Contexte .......................................................................................................5

    1.1 Présentation générale de Doc’INSA...............................................5

    1.1.1 Les thèses de l’INSA...................................................................5

    1.1.2 Objectifs du projet........................................................................5

    1.1.3 Méthode suivie.............................................................................5

    1.1.4 Déroulement du projet.................................................................6

    1.2 Etat de l’art .......................................................................................7

    1.2.1 Outils de l’édition électronique ....................................................7

    1.2.1.1 Coexistence de formats ..........................................................7

    1.2.1.2 Langages de description de page ..........................................7

    1.2.2 Serveurs de thèses existant........................................................9

    1.2.2.1 Le NDLTD................................................................................9

    1.2.2.2 Les projets comparables au NDLTD......................................9

    1.2.2.3 UMI...........................................................................................9

    1.2.2.4 Open Library Network OBN (Réseau PICA)..........................9

    1.2.2.5 Nature, nombre et format des documents ...........................10

    2 Choix techniques .......................................................................................13

    3 Présentation d’Adobe Acrobat ..................................................................14

    3.1 Le format PDF ...............................................................................14

    3.2 PDFMaker......................................................................................14

    3.3 PDFMark........................................................................................14

    3.3.1 L'opérateur pdfmark ..................................................................15

    3.3.2 Repères (OUT) ..........................................................................16

    3.3.3 Définition de liens.......................................................................17

    3.4 Acrobat Distiller..............................................................................17

    3.5 Acrobat Exchange.........................................................................18

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    3.6 Acrobat Reader..............................................................................18

    4 Format des documents électroniques......................................................19

    4.1 Règles d’édition .............................................................................19

    4.2 Schémas des liens hypertexte......................................................19

    4.2.1 Repères entre les documents constituant la thèse..................20

    4.2.2 Navigation dans chaque chapitre à l'aide des repères............21

    4.2.3 Autres liens au sein d'un document..........................................22

    5 La chaîne d’édition numérique..................................................................23

    5.1 Fonctionnement.............................................................................23

    5.2 Aperçu de l’interface......................................................................25

    Le guide de conversion..............................................................................27

    6 Résultats obtenus - Le projet CITHER.....................................................28

    7 Conclusion..................................................................................................29

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    � 7DEOH�GHV�LOOXVWUDWLRQV

    • Figure 1 : Liens et hyperliens – repères entre les fichiers ...............................20

    • Figure 2 : Liens et hyperliens – Repères dans le même fichier ......................21

    • Figure 3 : Autres liens dans les documents .....................................................22

    • Figure 4 : Opérations de la chaîne d'édition.....................................................23

    • Figure 5 : Fenêtre principale de l'application CEN...........................................25

    • Figure 6 : Propriétés d'un document - Extrait de la fenêtre principale ............26

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    � &RQWH[WH

    ��� 3UpVHQWDWLRQ JpQpUDOH GH'RF·,16$

    Doc'INSA, Bibliothèque scientifique et technique de l’INSA de Lyon, propose un ensemble deprestations destiné aux étudiants, enseignants, chercheurs et, de façon plus générale, à tout lepersonnel de l'INSA de Lyon. Les personnes extérieures à l'INSA peuvent également s’y inscrire.

    Doc'INSA dispose de 85 000 ouvrages, 1 740 collections de périodiques et 2 700 microformes,spécialisés en sciences de l’ingénieur.

    1800 thèses peuvent être consultées ou empruntées à Doc’INSA.

    ����� /HV WKqVHV GH O·,16$

    Doc’INSA est dépositaire officiel des thèses produites dans les laboratoires de l’INSA, et reçoit dece fait environ 130 documents de ce type chaque année.

    Afin d’élargir la diffusion de ces documents, Doc’INSA a souhaité mettre en place un serveur dethèses en texte intégral, sur Internet.

    En supposant que la quasi totalité de ces documents puisse être publiée sur Internet (accord del’auteur, non confidentialité du mémoire), le volume de données à traiter est conséquent (une thèseà traiter tous les deux jours – en moyenne). Il convenait donc de mettre en place des procédures etde développer des outils efficaces et d’un usage pratique.

    Les documents électroniques devaient également être accessibles facilement : l’interface WWWdevait permettre la recherche de documents par sujet ou par auteur, par année, proposer deslistes…

    ����� 2EMHFWLIV GX SURMHW

    La partie du projet 'thèses' (qui est aujourd'hui devenu le projet CITHER1) couverte par mon PFEétait à l'origine la conception et la réalisation (totale ou partielle) du service (production desdocuments et interface de consultation), et ce en collaboration avec Jean-Michel MERMET(webmestre du site de Doc'INSA, et de la recherche dans l'opac2).

    Le but à atteindre était la mise en place d'un service opérationnel à la fin du stage.

    ����� 0pWKRGH VXLYLH

    La conception du service et de la chaîne de production des documents s'est appuyée sur UMLi. Lesystème à concevoir ne s'appuyant pas sur des modèles complexes, la méthode n'a pas étéappliquée à tous les niveaux de conception. En revanche, elle a présenté l'avantage d'unformalisme relativement aisé à comprendre pour tous les acteurs du projet.

    1 Consultation en texte Intégral de THèses En Réseau2 Les ouvrages de Doc'INSA ne sont pas en accès direct : il est donc indispensable d'en rechercher la cote dans la base dedonnées de la bibliothèque.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    ����� 'pURXOHPHQW GX SURMHW

    A mi-parcours, mon projet de fin d'études a été recentré sur la chaîne d'édition des documentsnumériques (au vu des résultats de l'étude préalable). La partie FrontOffice a été réalisée par Jean-Michel MERMET, avec ma participation ponctuelle au niveau de certaines pages générées par lachaîne d'édition.

    L'étude détaillée a débouché sur la réalisation d'un prototype, lequel est devenu une applicationpouvant encore être améliorée, mais fiabilisée et testée en production durant la fin de mon stage.

    Toute la documentation de conception du projet CITHER est disponible sur le site Internet deDoc'INSA.

    Doc'INSA envisage la possibilité de distribuer librement l'application aux bibliothèques intéressées.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    ��� (WDW GH O·DUW

    En préambule à la phase de conception du service, j’ai établi un état de l’art en matière debibliothèque électronique (ou virtuelle), dans le cas des thèses ou mémoires de doctorat.

    Cet état de l’art a été établi suivant deux grands axes : les outils de l’édition électronique et lesservices existants.

    ����� 2XWLOV GH O·pGLWLRQ pOHFWURQLTXH

    La publication d’un document par voie numérique implique d’adopter un format de document. Eneffet, les informations d’aspect (corps de texte, police, marges, etc.) sont interprétées par le logicielde lecture qui reconstitue l’aspect du document.

    Plusieurs solutions existent ou sont en cours de développement. Elles sont pour la plupartincompatibles entre elles.

    1.2.1.1 Coexistence de formats

    L’arrivée des technologies numériques soulève la question de la pertinence de conserver uneversion papier. En effet, si le document est édité directement au format numérique, et n’est pas lanumérisation d’un ouvrage existant, quelle doit être la version à considérer comme ‘mère’ ?

    Dans le cas de la bibliothèque américaine (NDLTDii), le support papier disparaît, et s’il estéventuellement demandé par les départements d’étude, il est refusé par la bibliothèque (quirefusera même de numériser un document imprimé).

    La version numérique d’un document peut remplacer avantageusement une épreuve imprimée. Ilimporte cependant de s’assurer que l’on disposera des outils pour lire ces supports modernes…dans quelques décennies.

    Afin de permettre plus de souplesse lors de la consultation des documents, il peut être judicieux deproposer plus d’un format au lecteur. Un de ces formats pourra représenter le meilleur des supportsconnus (par exemple un fichier Acrobat), un second ne nécessitera aucun module supplémentairepar rapport aux «butineurs» Internet standard (un format HTML simple, voire un Texte ASCII parexemple).

    1.2.1.2 Langages de description de page

    La publication de documents scientifiques peut impliquer certaines contraintes : présence d’images,de graphiques, d’équations, document de taille importante, etc. Le format cible devait donc êtreadapté à ces contraintes, facile à mettre en œuvre, et suffisamment répandu pour que lesdocuments soient consultable sur la plupart des plates-formes.

    Les langages permettant de décrire un document ne manquent pas (HTML3, SGML4, XML5…).Conçus dans des buts différents, ils présentent chacun des avantages et des inconvénients. Ainsi,si SGML semble - au premier abord - idéal pour la publication de documents scientifiques, sa miseen œuvre reste très lourde, en l’absence d’outils intégrés. De plus, il n’existe pas à ce jour deprogramme – gratuit - permettant de visualiser facilement un document SGML en ligne.

    3 HyperText Markup Language4 Standard Generalized Markup Language5 Extensible Markup Language

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    Le langage HTML, qui ne nécessite pas d’autre programme de visualisation qu’un butineur Internetclassique, est malheureusement peu adapté à la représentation de gros documents scientifiques(pagination difficile, impossibilité de représenter des équations…). Les versions futures de HTMLpallieront peut-être à ces manques.

    Le format PostScript est rencontré sur de nombreux serveurs Internet pour la diffusion dedocuments ‘complexes’ (mémoires, manuels). Cependant, ce format n’est pas adapté à la lectureen ligne : il est encombrant et est conçu pour piloter une imprimante - et non pour être affiché àl’écran.

    L’étude de l’état de l’art a rapidement montré la quasi-unanimité existant autour du format PDF6 del’éditeur Adobe. Basé sur le langage PostScript, ce langage est adapté à la consultation en ligne dedocuments de taille importante, pouvant contenir des images haute résolution et des donnéesmultimédia, il permet de définir des hyperliens (au sein d’un fichier ou vers d’autres fichiers), desrepères (sorte de table des matières de liens hypertexte), et il peut être ‘optimisé’ afin d’êtreconsultable page par page. Enfin, le document peut être protégé contre l’impression, le copier-coller, la modification.

    Le programme d’affichage des fichiers PDF, Acrobat Reader, est gratuit et disponible sur la plupartdes plates-formes. Par ailleurs, le format PDF est un format documenté ce qui lui assure unecertaine pérennité.

    En revanche, le format PDF est un langage de représentation de page, impropre à l’archivage : Necomprenant pas la notion de structure logique de document (paragraphes, titres, etc.), il ne peutefficacement servir de source à une éventuelle conversion vers un nouveau format. Une solutiond’archivage des documents source (fournis par l’auteur et éventuellement retouchés sur le posted’édition) a donc été retenue, en attendant l’adoption future d’un format tel que SGML ou XML dansle cadre de ce même projet.

    Sur le site Internet d’Adobe Systems, une pageiii répertorie les sites Internet universitairesproposant des documents au format PDF.

    6 Portable Document Format

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    ����� 6HUYHXUV GH WKqVHV H[LVWDQW

    Les services existant et proposant un accès à des thèses (ou mémoires de doctorat)«électroniques» présentent un ensemble de caractéristiques (aspect, accès aux documents, formatde documents) qu’il est intéressant de comparer.

    Les services rencontrés et qui seront comparés ci-après sont les suivants :

    1.2.2.1 Le NDLTD

    Aux Etats-Unis, un projet baptisé The Networked Digital Library of Theses and Dissertationsii (ouNDLTD) a été initié au début des années 90. Paradoxalement, l’intérêt affiché de ce programme –consistant principalement à mettre des thèses à disposition des internautes – n’est pas tant depermettre l’accès à ces thèses que d’enseigner aux étudiants concernés les bases de ladocumentation électronique. Un accès facilité aux thèses et une économie de stockage papiercomptent bien sûr parmi leurs objectifs.

    Le principal acteur (en tant que bibliothèque) de ce projet est l’université d’état de Virginie iv, quipropose un serveur de thèses à l’aspect simplev. D’autres universités participent à ce projet etcertaines proposent d’ores et déjà des thèses ; parmi elles, l’université d’état de Caroline vi

    propose actuellement trois thèses au format Acrobatvii.

    1.2.2.2 Les projets comparables au NDLTD

    En marge du projet précédent (mais appelées à le rejoindre), d’autres universités proposent desthèses électroniques via Internet. Ainsi, l’université de Waterloo viii (Canada) dispose d’un serveurde thèses, ainsi que l’université de l’université du Michigan ix.

    Ces deux services sont, à cette date, au stade expérimental : dans le cas de l’université deWaterloo, le service propose une liste d’une quinzaine de thèses classées par auteur. Dans leMichigan, ce sont 4 thèses qui sont accessibles par mot clé, année, auteur, etc.

    Les universités de Toronto et de York x se sont associées pour étudier un projet comparable.

    1.2.2.3 UMI

    UMI propose un servicexi (payant) permettant aux auteurs de soumettre leurs thèses, et auxchercheurs de commander les ouvrages les intéressant.

    Les résumés des thèses sont disponibles en-ligne, et les fichiers PDF (quand ils existent) peuventêtre téléchargés moyennant finance.

    1.2.2.4 Open Library Network OBN (Réseau PICA)

    OBNxii réalise l’intégration de plusieurs systèmes existants. Il permet d’effectuer des recherches àl’aide de catalogues situés au Pays-Bas.

    Le service WebCAT est un de ces catalogues. Ce service expérimental permet d’accéder à desdocuments en texte intégral.

    Le réseau OBN demande une identification (login) de la part de l’utilisateur. Les recherches que j’aipu consulter sont des versions de démonstration.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    1.2.2.5 Nature, nombre et format des documents

    1.2.2.5.1 Nature des documents proposésLes bibliothèques électroniques peuvent proposer virtuellement tout document (grâce auxpossibilités du multimédia), ce qui peut inclure des objets ou des séquences extraites de films.Cependant, l’usage est aux documents simplement composés de texte et d’image. La raison en estsimple : le support «cible» du rédacteur est encore le papier dans la plupart des cas.

    Les services comparés proposent des thèses. Une thèse peut être un simple texte structuré, mais ilest bien rare que celui-ci ne soit accompagné d’illustrations. Celles-ci peuvent aller du simpleschéma noir et blanc à la photographie (images issues d’observations). Il est probable que lespossibilités du support multimédia donne l’idée aux auteurs d’ajouter des séquences vidéo ousonores à leur travail.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    1.2.2.5.2 Etat et possibilités des services visitésChiffres et caractéristiques relevés le 19 juin 1998.

    Organisme Nature des

    documents

    Nbre. Format Accès à l’information

    Digital Library of ETDs

    (Université de Virginie)Thèses

    Mémoires

    830 Résumés en HTML,

    documents en PDF

    Recherche : (sur les

    résumés et le titre), par

    OpenText (phrase, mots

    clés) ou Dienst (non

    opérant au 18/12/97)

    Liste : par auteur, liste des

    documents récents

    UMI ProQuest Digital Dissertations

    Pilot Site

    (Service expérimental)

    Thèses

    Mémoires

    >100 Résumés en HTML,

    documents en PDF

    Recherche : par mots clés

    (sur les résumés et le

    titre), par auteur, par école

    Liste : par sujet ou école

    NCSU Libraries

    (Université de Caroline)Thèses et

    mémoires

    12 Résumés en HTML,

    documents en PDF

    Liste : apparemment non

    classée

    UW Electronic theses and

    dissertations

    (Université de Waterloo)

    Thèses et

    mémoires

    17 Résumés en HTML,

    documents en PDF

    Recherche : sur les

    résumés, par mots clés,

    restriction possible sur

    l’auteur, la matière ou

    l’école

    University of Michigan Dissertations

    and Thesis library

    (Université du Michigan)

    Mémoires 4 SGML (4) et HTML (1) Recherche : par mots clés

    en texte intégral ou sur le

    résumé, par auteur,

    responsable, numéro UMI,

    année, sujet, citation

    bibliographique…

    Liste : par auteur, sujet ou

    année

    Recherche inopérante au

    12/12/97

    The Joint Electronic Thesis and

    Dissertation Project (…)

    (universités de Toronto et de York)

    Thèses et

    mémoires

    0 - -

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    1.2.2.5.3 A propos des formatsDans le cadre du projet américain du LDLTDii, le choix de publier les thèses au format PDF a étéfait en 1993. Ce choix est présenté comme temporaire, et semble appelé à évoluer vers une autresolution plus souple, langage de type description de pages et lié aux fichiers image (ou vidéo)extérieurs.

    Les thèses disponibles sur le serveur de Virginia Tech. ont été converties en PDF (Adobe Acrobat)par les étudiants, suivant un protocole exposé par l’université. Elles n’exploitent pas toutes lespossibilités de ce format (liens, liste de repères, optimisation pour la consultation en ligne…), maisil faut leur reconnaître un aspect indéniablement plus propre que celui de pages HTML ‘classiques’.

    UMI proposera prochainement ses documents en texte intégral. Le site «pilote» propose un accèslibre à quelques documents au format PDF.

    L’université du Michigan a adopté une autre direction, et propose ses documents en double formatHTML / SGML, ou bien exclusivement en SGML .

    Le format PDF d’Adobe semble donc être adopté dans le milieu de l’édition électronique.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    � &KRL[�WHFKQLTXHV

    Au vu de l'état de l'art, nous avons fait un certain nombre de choix techniques :

    • Adoption de PDF pour la représentation des documents (choix pouvant être remis en questionà moyen terme, suivant les évolutions des langages tels que XML),

    • Utilisation de l'application Doris Web (déjà utilisée pour l'opac) pour la recherche des thèsesnumérisées,

    • Présence, pour chaque thèse, d'un "Pont d'embarquement", page HTML reprenant la noticebibliographique de la thèse, contenant les liens vers les fichiers PDF, et pouvant être indexéepar un moteur de recherches (tel Altavista),

    • Adoption de Word comme source privilégiée (importation possible des documents édités sousd'autres traitements de texte) ; les documents rédigés en TEX seront convertis en PostScriptpar leurs auteurs, si possible suivant quelques consignes simples.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    � 3UpVHQWDWLRQ�G·$GREH�$FUREDW

    ��� /H IRUPDW 3')

    Le format PDF est un langage de description de page. Comparable dans une certaine mesure auformat PostScript (dont il est issu : il en reprend le modèle de représentation), il permet dereprésenter des pages complexes (graphiques, mise en page, polices de caractères) telles qu’ellesont été conçues.

    Ce format présente d’importants avantages sur PostScript : il est beaucoup plus « léger »(compression des données), il est adapté à la lecture en-ligne (téléchargement page par page,logiciel de visualisation Acrobat Reader disponible sur la quasi-totalité des plates-formes), il peutcomporter des liens hypertexte.

    Enfin, il peut comporter des images haute résolution (que le lecteur peut visualiser minutieusementà l’aide de la fonction ‘zoom’ d’Acrobat Reader), et même des séquences multimédia (sonoreset/ou visuelles).

    Le format PDF est en outre complètement documenté, gage de pérennité. Cette documentation estdisponible en lignexiii.

    Seuls les outils de la suite Acrobat utilisés pour ce projet sont présentés ici.

    ��� 3')0DNHU

    Adobe a développé une macrocommande Word, nommée PDFMaker, qui permet la création defichiers PDF de grande qualité à partir de Word 97.

    Le principe de cette macro est de créer un fichier PostScript enrichi de commandes pdfmark,commandes générées automatiquement à partir de la structure du document Word.

    Ce programme peut ainsi générer des liens PDF vers les notes de fin ou de bas de page, depuis lesommaire, depuis les URL détectées dans le texte ; il peut en outre générer des repères PDF pourtous les titres rencontrés.

    Si un document Word a été rédigé en utilisant les styles de titre, le sommaire et les notes Word, ilpourra être converti via PDFMaker en un fichier PDF « riche ».

    /D YHUVLRQ DFWXHOOH GH 3')0DNHU HVW DGDSWpH DX[ YHUVLRQV DQJOR�VD[RQQHV GH :RUG� -H O¶DL OpJqUHPHQWPRGLILpH SRXU TX¶HOOH GpWHFWH OHV QRP GH FKDPSV VRPPDLUH G¶XQ GRFXPHQW IUDQoDLV� M¶DL pJDOHPHQW UHQGXFRQGLWLRQQHOOH OD FRQYHUVLRQ GX ILFKLHU 3RVW6FULSW HQ 3') �YRLU OH PDQXHO WHFKQLTXH��

    ��� 3')0DUN

    Un fichier PostScript « normal » ne comprend aucune information de structure, aucun lienhypertexte ou aucun repérage.

    Les fichiers PostScript peuvent facilement être convertis en PDF via Acrobat Distiller. Adobe a doncintégré à PostScript un nouvel opérateur, l’opérateur pdfmark), qui permet d’ajouter au fichiersource PostScript des consignes de conversion (interprétées par Distiller).

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    L’opérateur pdfmark obéit à une syntaxe définie dans le "pdfmark Reference Manualxiv" rédigé parAdobe. Cette partie décrit brièvement les opérateurs qui sont utilisés par l'application.

    ,O HVW LPSRUWDQW� SRXU OD FRPSUpKHQVLRQ GHV V\QWD[HV SGIPDUN� GH FRQQDvWUH OH SULQFLSH GH QXPpURWDWLRQGHV SDJHV GXQ ILFKLHU 3') �

    � 3') QH FRQQDvW SDV OH QXPpUR TXL DSSDUDvW pYHQWXHOOHPHQW VXU XQH SDJH� /HV SDJHV VRQW QXPpURWpHV HQVpTXHQFH � OD SUHPLqUH SDJH HVW OD SDJH QXPpUR �� /HV QXPpURV GH SDJH XWLOLVpV SDU SGIPDUN VRQW GRQFFHV QXPpURV VpTXHQWLHOV�

    ����� /RSpUDWHXU SGIPDUN

    L'opérateur pdfmark prend pour arguments un objet mark, un nombre variable de paires clé-valeur, et un objet nom.

    La syntaxe générale de l'opérateur pdfmark est la suivante :

    […paires clé-valeur…

    TYPE pdfmark

    TYPE est un nom définissant le type d'opérateur pdfmark .

    Afin que les imprimantes ne supportant pas la syntaxe pdfmark puissent gérer correctement lesfichiers PostScript ainsi modifiés, il convient d'ajouter le code suivant en en-tête du fichier PS :

    /pdfmark where{pop} {userdict /pdfmark /cleartomark load put} ifelse

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ����� 5HSqUHV �287�

    Un repère (bookmark ou outline entry suivant la désignation d'origine) est décrit par l'opérateurpdfmark et le nom OUT.

    La syntaxe est la suivante :

    [ /Title string/Count int…Action-specifying key–value pairs…/OUT pdfmark

    Clé Type Sémantique

    Title Chaîne (Obligatoire) Libellé du repère. Limité (sic) à 65.535 caractères, maximumconseillé : 32 caractères afin d'être facilement lisible avec Acrobat Reader.

    Count Entier (Optionnel) Définit le nombre et l'apparence des repères "fils". Pour plusde détails consulter la documentation d'Adobe.

    • 7DEOHDX � � $WWULEXWV GHV UHSqUHV

    Le lien doit de plus contenir des paires clé-valeur spécifiant l'action associée au lien (voir ci-après).

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ����� 'pILQLWLRQ GH OLHQV

    PDF utilise trois méthodes pour définir les événements associés à un repère (l'ouverture d'unfichier, etc.) : les vues, les actions et les destinations nommées.

    Les Vues spécifient un emplacement dans le fichier courant.

    Clé Type Sémantique

    Action Nom oudictionnaire

    Définit le type d'action. Doit être un nom prédéfini ou un dictionnaire décrivantl'action.

    • S'il s'agit d'un nom :

    GoTo : Va à une page spécifiée, au facteur d'agrandissement demandé.

    GoToR : Ouvre un autre document à la page et au facteurd'agrandissement demandés.

    Launch : Ouvre un document ou une application.

    Article : Saute à un article.

    • Les dictionnaires définissant une action sont généralement utilisés pouractiver des plug-ins.

    Dest Nom, entier, ouchaîne

    Article ou destination nommée. S'il s'agit d'une destination, elle doitcorrespondre à une destination définie avec le type DEST.

    • 7DEOHDX � � 7\SHV GDFWLRQV

    ��� $FUREDW'LVWLOOHU

    Acrobat Distiller est l’élément de la suite Acrobat qui convertit un fichier PostScript (.PS) en fichierAcrobat (.PDF).

    Cette application est paramétrable : les paramètres de compression, de sous échantillonnage desimages, d’inclusion des polices, etc.… sont accessibles à l’utilisateur. Toutes ces options sontinscrites dans un fichier .INI, éventuellement modifiable par une autre application.

    Si le fichier source PostScript contient des commandes pdfmark, Distiller génère les hyperliens,repères, et informations PDF. En revanche, Distiller ne sait pas générer les miniatures de pages.Cette tâche doit être confiée à Exchange.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ��� $FUREDW ([FKDQJH

    Acrobat Exchange est (comme son nom le laisse supposer) l’application principale de la suiteAcrobat. Si un fichier doit être modifié, édité, enrichi, cette opération se fait dans Exchange.

    Exchange permet de créer et modifier les repères Acrobat, les liens, les vues miniatures. Il permetégalement d’optimiser les fichiers PDF et de définir les options de protection.

    Ces deux dernières fonctions sont disponibles via l’API Exchangexvi, API qui permet de piloterExchange via des mécanismes OLE.

    Echange permet également le travail de groupe sur des fichiers PDF (échange de notes).

    ��� $FUREDW5HDGHU

    Reader est le logiciel (gratuit) qui permet l’affichage des fichiers PDF sur l’écran. Reader s’intègreaux butineurs Internet les plus répandus (Netscape et Explorer). Il permet l’affichage des PDF etleur lecture à l’écran.

    Si ces opérations n’ont pas été interdites par l’éditeur, il permet également le copier-coller du texteet des graphiques, et l’impression du document.

    Acrobat Reader est disponible sur Internet ; le format PDF peut donc être utilisé sur un site Websans risque que l’utilisateur soit dans l’impossibilité de le lire.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    � )RUPDW�GHV�GRFXPHQWV�pOHFWURQLTXHV

    Le résultat de la chaîne d’édition est un document électronique publiable. Cette partie traite de cesdocuments (forme, caractéristiques).

    ��� 5qJOHV G·pGLWLRQ

    Les documents électroniques produits dans le cadre du projet "thèse" de Doc'INSA seront mis àdisposition d'un large lectorat. Le nombre de document proposés par ce service grossirarapidement (+150/an dès le début), et il est important que ces documents présentent une certainecohérence.

    Cette cohérence apportera aux lecteurs un confort de consultation. Du point de vue de l'opérateureffectuant la conversion du document original en document électronique, ces règles seront commeles points d'une procédure standard, guidant ainsi les opérations. Enfin, dans le cas du retraitement(correction) d'un document électronique, ou d'un remaniement du service, cette cohérence faciliterale travail des opérateurs.

    /HV UqJOHV G¶pGLWLRQ VRQW SULQFLSDOHPHQW GHV SDUDPpWUDJHV G¶$FUREDW� /H GpFRXSDJH HQ ILFKLHUV� ODFRPSUHVVLRQ GHV LPDJHV� O¶pFKDQWLOORQQDJH GHV SROLFHV GH FDUDFWqUHV� O¶DVSHFW GHV OLHQV� OHV PpWDGRQQpHV3')� HWF� VRQW VSpFLILpHV GDQV XQ GRFXPHQW LQFOXV HQ DQQH[H �5qJOHV G¶pGLWLRQ pOHFWURQLTXH�

    ��� 6FKpPDVGHV OLHQV K\SHUWH[WH

    Les fichiers PDF produits par la chaîne d’édition comportent des liens hypertexte. Ceux-ci sontgénérés automatiquement, d’après les informations contenues dans les fichiers sources. Parconséquent, la création de ces liens dépend de la « richesse » du document source (utilisation desstyles de titre, etc.).

    /HV VFKpPDV FL�DSUqV UHSUpVHQWHQW OH FDV LGpDO G¶XQ GRFXPHQW FRPSRUWDQW WRXV OHV W\SHV GH OLHQV�

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ����� 5HSqUHV HQWUH OHV GRFXPHQWV FRQVWLWXDQW OD WKqVH

    Les différents fichiers PDF constituant une même thèse ont en commun le premier niveauhiérarchique des repères, chaque étiquette de ce niveau correspondant à un fichier PDF.

    Ainsi, la navigation entre ces fichiers est transparente pour l'utilisateur.

    Légende des l iens :

    Titre etremerciements

    Titre et remerciements Sommaire 1. Chapitre 1 2. Chapitre 2 (...) Annexes

    "Repères"

    Sommaire

    Sommaire 1. Chapitre 1 1.1 Paragraphe 1 1.2 paragraphe 2 2. Chapitre 2 2.1 (...)

    "Repères"

    Chapitre 1

    Titre et remerciements Sommaire

    � 1. Chapitre 1 1.1 Paragraphe 1.2 Paragraphe 2. Chapitre 2 (...) Annexes

    "Repères"

    Chapitre 2

    "Repères"

    Annexes

    "Repères"

    Chapitre 1

    blablablablablablablablablablablablalablablablahhh......

    Repère ouvrant un f ichier

    • )LJXUH � � /LHQV HW K\SHUOLHQV ± UHSqUHV HQWUH OHV ILFKLHUV

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ����� 1DYLJDWLRQ GDQV FKDTXH FKDSLWUH j ODLGH GHV UHSqUHV

    La structure logique de chaque chapitre est reprise en détail par les repères Acrobat. Ainsi, lahiérarchie des titre y est reprise et un clic sur un repère "saute" au texte correspondant.

    Chapitre 1

    Titre et remerciements Sommaire

    � 1. Chapitre 1 1.1 Paragraphe 1.2 Paragraphe 2. Chapitre 2 (...) Annexes

    "Repères"

    Chapitre 1

    blablablablablablablablablablablablalablablablahhh......

    • )LJXUH � � /LHQV HW K\SHUOLHQV ± 5HSqUHV GDQV OH PrPH ILFKLHU

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ����� $XWUHV OLHQV DX VHLQ GXQ GRFXPHQW

    D'autres liens sont générés automatiquement lors de la conversion au format PDF : les renvois auxnotes de fin ou de bas de page sont "sensibles" et renvoient aux libellés correspondant. Lesadresses Internet (URL) sont également converties en liens accédant à l'adresse à l'aide duprogramme approprié.

    Les lignes du Sommaire sont converties en autant de liens vers le titre correspondant (dans le casou la source est constituée d’un seul fichier Word ou PS – convenablement structuré).

    * : Blah blah blah blah blahblah blah blah blah.. .

    Blah blah blah blah blahblah blah blah blah1 b lahblah blah blah blah blah blahblah bla ht tp: / /www.blah.netblah blah blah* b lah b lahblah blah blah blah blah . . .

    1 : Blah blah blah.. .

    Note debas de page

    Notede f in

    AdresseInternet

    • )LJXUH � � $XWUHV OLHQV GDQV OHV GRFXPHQWV

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    � /D�FKDvQH�G·pGLWLRQ�QXPpULTXH

    ��� )RQFWLRQQHPHQW

    L’application principale a été baptisée CEN (Chaîne d’édition numérique). Cet outil permet lamanipulation de projets d’édition, projets rassemblant un ensemble de fichiers source qui seronttraités par lot.

    Un projet, au sens de l’application décrite, rassemble plusieurs attributs :

    � des informations générales sur le document (Auteur, Titre, Date, Mots-clés),

    � un ensemble de fichiers source, chacun d’entre-eux ayant en outre un titre (titre de la partiequ’il représente) et un numéro d’ordre dans le document,

    � un ensemble éventuel de documents numérisés en sus, à intégrer à la thèse et à archiver avecle reste.

    L’application pilote Word, Acrobat Distiller et Exchange7, et modifie par ailleurs directement unepartie des fichiers.

    :RUG

    3')

    +70/

    ,PDJHV� SDJHV«

    3') 3XEOLDEOH

    c

    d e

    f

    3RVW6FULSW 3RVW6FULSW

    + Liens inter-documents

    3RVW6FULSW

    + Liens intra-document

    • )LJXUH � � 2SpUDWLRQV GH OD FKDvQH GpGLWLRQ

    La conversion se déroule en quatre étapes (dont les numéros sont repérés sur la Figure 4).

    7 Acrobat Distiller et Exchange font partie de la suite Acrobat d’Adobe.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    c Tout d’abord, la macrocommande Word (Adobe PDFMakerxv, légèrement modifiée) crée unfichier PostScript enrichi d’instructions pdfmark à l’intention d’Acrobat Distiller. Cettemacrocommande crée (le cas échéant) des liens à partir des champs ‘note’, ‘table’, etc. Elle créeégalement un repère Acrobat pour chaque titre.

    d Les fichiers PostScript obtenus sont alors directement modifiés par l’application qui y ajoute desrepères (toujours via pdfmark) désignant les autres fichiers. Il devient alors possible de parcourirtoute une thèse sans se soucier de son découpage éventuel en plusieurs fichiers PDF.

    e Les fichiers PostScript sont ensuite convertis en PDF par Distiller.

    f Enfin, les fichiers PDF sont ‘retraités’ à l’aide d’Exchange : leurs champs titre, sujet, auteur…sont renseignés ; les miniatures de pages sont créées et les fichiers optimisés pour une lecture enligne (opération permettant au serveur d’envoyer le document page à page).

    Dans le cas où les fichiers fournis par l’auteur sont de format PostScript, la première étape (Word)est ignorée.

    A ce point, le traitement par lot est terminé, et un rapport de conversion a été généré.

    L’application génère en outre un ‘pont d’embarquement’ vers la thèse, page HTML rassemblant laréférence bibliographique du document et des liens vers tous les fichiers PDF. Enfin, elle peutpréparer les fichiers à un archivage en les rassemblant dans un répertoire.

    L’opérateur peut facilement modifier les fichiers (source ou produits) depuis l’application (appel deWord ou d’Acrobat Exchange). Il peut ainsi vérifier la forme des documents Word, ou ajouter deséléments non numérisés ou des séquences multimédia aux fichiers PDF.

    Cette application programmée en Delphi 3 dans l’environnement Windows contrôle les autresapplications via plusieurs mécanismes : Word et Exchangexvi sont pilotés via COM/OLE8, alors queDistillerxvii est contrôlé par des messages Windows9.

    /¶DSSOLFDWLRQ UHSURGXLW OH ORRN IHHO GHV DSSOLFDWLRQ :LQGRZV ���17�� DILQ GH IDFLOLWHU VRQ XWLOLVDWLRQ�

    8 Common Object Model / Object Link Embedding : modèle objet de Windows.9 Mécanisme de base de communication entre les entités de Windows

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ��� $SHUoXGH O·LQWHUIDFH

    • )LJXUH � � )HQrWUH SULQFLSDOH GH ODSSOLFDWLRQ &(1

    La fenêtre principale de l’application CEN rassemble plusieurs éléments :

    � Une barre de menus et une barre d’outils, donnant accès aux commandes,

    � Une petite arborescence donnant accès aux fichiers du projet,

    � La liste des fichiers du projet, ou la liste des caractéristiques du document (voir ci-après),

    � Un panneau d’aide contextuelle.

    /HV GpWDLOV GH O¶LQWHUIDFH� GHV FRPPDQGHV HW GH OD SURFpGXUH GH FRQYHUVLRQ GRQW GRQQpV GDQV OHPDQXHOGH O·XWLOLVDWHXU �LQFOXV HQ DQQH[H� HW GDQV OH JXLGH GH FRQYHUVLRQ�

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    • )LJXUH � � 3URSULpWpV GXQ GRFXPHQW � ([WUDLW GH OD IHQrWUH SULQFLSDOH

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    ��� /H JXLGH GHFRQYHUVLRQ

    La seconde application développée pour ce projet est un guide deconversion. Il revêt la forme d’une liste de contrôle dont les pointspeuvent être cochés durant la procédure.

    La présence de ce guide de conversion se justifie par le fait que letraitement des documents se fait par lots : Il est important de ne pasomettre d’opération avant de lancer le traitement. Par ailleurs, uncertain nombre d’opérations ne peuvent être automatisées, les API10

    des outils Acrobat ne le permettant pas. Ces opérations sontsignalées à l ‘opérateur par le guide de conversion.

    Le guide de conversion n’impose pas l’ordre d’exécution des tâches.En revanche, il permet à l’opérateur de retrouver rapidement lesopérations restant à accomplir.

    Enfin, le guide de conversion propose un accès facilité aux outils dontpeut avoir besoin l’opérateur : programme de numérisation d’images,programmes de lecture d’archives (les fichiers fournis par les auteursétant souvent compressés), programme de création de cédérom, etc.

    Le contenu du guide de conversion doit être facilement modifiable : ilest par conséquent implémenté en HTML.

    L’affichage est de forme arborescente : ceci limite l’encombrementdu guide de conversion, et facilite la navigation entre les tâches.

    L’opérateur coche une case devant chaque point.

    Les points déjà validés sont affichés en bleu (ici : « Création durépertoire… », « Copie des fichiers… », …). L’opérateur peut ainsivérifier rapidement les point manquants.

    10 Application Programming Interface

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    � 5pVXOWDWV�REWHQXV���/H�SURMHW�&,7+(5

    A l’heure où sont tapées ces lignes, le service CITHER11 est ouvert (à l’adresse :http://csidoc.insa-lyon.fr/these/). Il propose 8 thèses en texte intégral.

    La chaîne d’édition fonctionne (elle a servi à produire une partie des thèses disponibles).L’application est stabilisée, elle pourra éventuellement être modifiée ou adaptée.

    La macro PDFMaker devrait être mise à jour par Adobe. Si l’API de ce programme est conservée(le contraire serait surprenant), toute nouvelle version pourra être pilotée par la chaîne d’édition.En revanche, il faudra y ajouter quelques lignes si l’on veut pouvoir interdire la conversionautomatique de PS en PDF (appel à Distiller).

    Une première version du guide de conversion a été créée, elle sera « affinée » à l’usage. (Ecrit enHTML, il est facilement modifiable).

    La base de connaissances n’est pas terminée : le modèle de fiche d’incident existe, mais les fichessaisies ne sont pas indexées. Cette indexation sera possible quand un moteur sera disponible auniveau du réseau ROCAD (indexation de pages HTML produites à partir du modèle).

    Enfin : l'application actuelle ne s'appuie pas sur une base de données. Cependant, le format defichier (propriétaire) utilisé pour décrire les projets est simple (type fichier INI de Windows) etdocumenté (manuel technique de l'application). Il sera donc aisé de réaliser une "moulinette" afind'alimenter une base de données.

    11 Consultation en texte Intégral des THèses En Réseau

    http://csidoc.insa-lyon.fr/these/

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��

    � &RQFOXVLRQ

    Le choix du format PDF ayant été fait pour le début du projet thèses, la solution actuelle peutfonctionner plusieurs années. Elle nécessitera probablement quelques aménagements mineurs(adaptation aux nouvelles versions des outils logiciels afin de prendre en compte leursnouveautés), mais devrait permettre la conversion de la plupart des thèses des quelques années àvenir.

    La conversion de documents source PostScript (documents créés sous TEX) devra être améliorée(identification de la procédure à suivre afin de générer un fichier PostScript enrichi pour laconversion, puis rédaction de consignes à donner aux rédacteurs).

    La procédure d’archivage reste à préciser.

    Les consignes de création des fichiers PostScript (pour les auteurs utilisant TEX) restent à rédiger.Leur principe est exposé dans les documents de conception.

    Les outils de l’édition de documents XML devraient arriver à maturité rapidement. Ce format pourraconstituer une nouvelle direction pour le projet thèses.

  • DOC'INSA CHAINE D'EDITION NUMERIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES

    5pIpUHQFHV�ELEOLRJUDSKLTXHV

    i FOWLER, Martin , UML distilled : applying the standard object modeling language, Martin Fowler with Kendall Scott ;foreword by Grady Booch, Ivar Jacobson and James Rumbaugh . - Reading, Mass. : Addison Wesley Longman , 1997 . - xviii,179 p. . - Addison-Wesley object technology series

    ii The Networked Digital Library of Theses and Dissertations , NDLTD Initiative. [On-line] [December 1, 1997].Available on Internet :

    iii Adobe Systems incorporated , Adobe Acrobat: PDF Directory: Education. [On-line] [December 1997].Available on Internet :

    iv Virginia polytechnic institute and state university , Virginia Tech. [On-line] [November 11, 1997].Available on Internet :

    v Virginia polytechnic institute and state university , Digital Library of ETDs. [On-line] [December 9, 1997].Available on Internet :

    vi North Carolina State University , NCSU Libraries Information System. [On-line] [October 5, 1997].Available on Internet :

    vii Adobe Systems incorporated , Adobe Acrobat. [On-line] [December 1997].Available on Internet :

    viii University of Waterloo Electronic Thesis Project Team (ETPT) , UW Electronic Theses and Dissertations Pilot ProjectETD Server. [On-line] [October 7, 1997].Available on Internet :

    ix University of Michigan , The University of Michigan Dissertation and Thesis Library. [On-line] [August 26, 1997].Available on Internet :

    x Joint Electronic Thesis and Dissertation Project , The Joint Electronic Thesis and Dissertation Project of the Faculty ofInformation Studies at the University of Toronto, University of Toronto Libraries, and York University Libraries. [On-line][November 20, 1997].Available on Internet :

    xi UMI Company , UMI ProQuest Digital Dissertations. [On-line]. [December 11, 1997].Available on Internet :

    xii Pica, Pica II OBN. [ON-line] [January 8, 1997].Available on internet :

    xiii Adobe Systems incorporated , PDF Reference Manual, [November 27, 1996]Available on Internet :

    xiv Adobe Developper Support , pdfmark Reference Manual – Technical Note #5150 [July 22, 1997]Available on Internet : xv Adobe Adobe PDFMaker 1.0 for Microsoft Word 97 [On-line] http://www.adobe.com/supportservice/custsupport/LIBRARY/4d9e.htmxvi Adobe Developer Support , Acrobat Viewer Interapplication Communication Support OverviewTechnical Note #5164xvii Adobe Developer Support , Acrobat Distiller Control Interface SpecificationTechnical Note #5158

    http://www.ndltd.orghttp://www.adobe.com/prodindex/acrobat/edu.htmlhttp://www.vt.eduhttp://www.theses.orghttp://www.lib.ncsu.eduhttp://www.adobe.com/prodindex/acrobathttp://www.lib.uwaterloo.ca/~uw-etpt/pilot.htmlhttp://dns.hti.umich.edu/misc/diss.example/http://www.fis.utoronto.ca/etdhttp://www.pica.nl/http://wwwlib.umi.com/dissertations/mainhttp://www.adobe.com/supportservice/devrelations/PDFS/TN/PDFSPEC.PDFhttp://www.adobe.com/supportservice/custsupport/LIBRARY/4d9e.htmhttp://www.adobe.com/supportservice/custsupport/LIBRARY/4d9e.htm

  • CHAINE D'EDITION NUMERIQUE ANNEXE A : MANUEL TECHNIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES

    $QQH[HV

    $QQH[H�$�²�0DQXHO�7HFKQLTXH

  • CHAINE D'EDITION NUMERIQUE ANNEXE B : MANUEL DE L’UTILISATEUR

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES

    $QQH[H�%���0DQXHO�GH�O·XWLOLVDWHXU

  • CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    $QQH[H�&���5qJOHV�G·pGLWLRQ�pOHFWURQLTXH

    Caractéristique Caractère Forme Alternative Outil

    Format defichier

    Obligatoire PDF Acrobat

    Formatsannexes

    Optionnel Tout type de fichier

    Découpage enfichierslogiques

    Recommandé Un fichier par partie :

    • Titre / Introduction(titre.pdf)

    • Sommaire(sommaire.pdf)

    • Chapitres(chapX.pdf)

    • Bibliographie(biblio.pdf)

    • Annexes(annexeX.pdf)

    Monolithique(un seul fichier)

    • (These.pdf)

  • CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    Caractéristique Caractère Forme Alternative Outil

    Propriétés PDF Obligatoire • Titre

    • Sujet

    • Auteur

    Automatique(chaîned'édition)

  • CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    Caractéristique Caractère Forme Alternative Outil

    Moded'affichage àl'ouverture

    Recommandé Page & Bookmarks, Premièrepage, "Fit page"

    AcrobatDistiller(paramétrageautomatique)

    Repères PDF(bookmarks)

    Obligatoire Un repère par titre, hiérarchierespectée (Trois niveauxconseillés).

    Les parties suivantes doiventapparaître :

    TitreSommaireIntroductionChapitre 1 – intitulé 1.1 intitulé…ConclusionBibliographieAnnexe 1 – intitulé…

    Un repère par partieprincipale (Titre,sommaire, chapitres,bibliographie, annexes)

    Générationautomatique(source TeXou Word avecstyles), ajoutmanuel avecAcrobatExchange

    Miniatures PDF Recommandé Génération de toutes lesminiatures de pages

    AcrobatExchange

    Liens PDF Recommandé Liens :

    • Depuis le sommaire

    • Vers les notes de bas depage

    • Vers les notes de fin

    • Liens Internet

    Sous-ensemble de la listeprécédente

    Générationautomatique,et/ouExchange

    Affichage desliens PDF

    Fortementrecommandé

    Liens invisibles, s'inversant àla sélection

    Tout autre paramétrage AcrobatDistiller(paramétrageautomatique)

  • CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�

    Caractéristique Caractère Forme Alternative Outil

    Protection PDF Obligatoire Protection contre lamodification

    Protectionssupplémentairesenvisageables

    AcrobatExchange

    Optimisation duPDF

    Obligatoire Le fichier est "optimisé"(réduction de sa taille,marquage pour le"byteserving" – visualisationpar page)

    AcrobatExchange

    Index AcrobatCatalog 12

    Recommandé Un index nommé index.pdxest attribué a tous les fichiers

    AcrobatCatalog /Exchange

    Choix decompressiondes images(PDF)

    Recommandé • Compression du fichier :OUI

    • Images couleur / niveauxde gris :Pas de réduction(downsampling),Compression manuelleZIP (4 bits)

    • Monochrome :Pas de réduction,compression manuelleCCITT Gpe. 4.

    AcrobatDistiller(paramétrageautomatique)

    Autres optionsPDF

    Fortementrecommandé

    • Compatible Acrobat 3.0

    • Polices incorporées,"subset" en-dessous de25%

    • Modèle RGB

    AcrobatDistiller(paramétrageautomatique)

    12 Cet index n’est pas directement exploitable à la lecture en-ligne, cependant, il pourra ultérieurement être lu par un serveurde recherches tel qu’AltaVista ou Index Server.

  • CHAINE D'EDITION NUMERIQUE ANNEXE D : DOCUMENTS DU PROJET

    0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES

    $QQH[H�'�²�'RFXPHQWV�GX�SURMHW

    Documents de gestion de projet

    � Dossier d’initialisation

    Document marquant le début du projet, présentation des méthodes et outils choisis, del’organisation du projet

    � Dossier de bilan

    Document clôturant le projet, listant les objectifs atteints et les résultats

    Documents de conception

    � Note de synthèse – Etat de l’art

    Etat de l’art des bibliothèques électroniques de thèses et des outils de l’édition électronique

    � Dossier d’étude préalable

    Etude générale du sujet

    � Dossier d’étude détaillée

    Conception des outils à réaliser

    Documentation de l’application

    � Manuel de l’utilisateur

    Référence des commandes et options de l’application

    � Manuel technique

    Guide du développeur

    Rapports de Projet de Fin d’Etudes

    � Rapport de synthèse

    Article de synthèse présentant le projet

    � Rapport de PFE

    Le présent rapport

    http://csidoc.insa-lyon.fr/these/doc/dossier_initialisation.pdfhttp://csidoc.insa-lyon.fr/these/doc/recherche_bibliographique.pdfhttp://csidoc.insa-lyon.fr/these/doc/rapport_prealable.pdfhttp://csidoc.insa-lyon.fr/these/doc/rapport%20_detaillee.pdfhttp://csidoc.insa-lyon.fr/these/doc/rapport_synthese.pdf

    Rapport de Projet de Fin d’ÉtudesRemerciementsSommaire (hyperliens)ContextePrésentation générale de Doc'INSALes thèses de l'INSAObjectifs du projetMéthode suivieDéroulement du projet

    Etat de l'artOutils de l'édition électroniqueCoexistence de formatsLangages de description de page

    Serveurs de thèses existantLe NDLTDLes projets comparables au NDLTDUMIOpen Library Network OBN (Réseau PICA)Nature, nombre et format des documentsNature des documents proposésEtat et possibilités des services visitésA propos des formats

    Choix techniquesPrésentation d'Adobe AcrobatLe format PDFPDFMakerPDFMarkL'opérateur pdfmarkRepères (OUT)Définition de liens

    Acrobat DistillerAcrobat ExchangeAcrobat Reader

    Format des documents électroniquesRègles d'éditionSchémas des liens hypertexteRepères entre les documents constituant la thèseNavigation dans chaque chapitre à l'aide des repèresAutres liens au sein d'un document

    La chaîne d'édition numériqueFonctionnementAperçu de l'interfaceLe guide de conversion

    Résultats obtenus - Le projet CITHERConclusionRéférences bibliographiquesAnnexesA - Manuel TechniqueB - Manuel de l'utilisateurC - Règles d'édition électroniqueD - Documents du projet