6HUYHXU�GH�WKqVHVHQ�WH[WH�LQWpJUDO
Rapport de Projet de Fin d’Études
,16$�GH�/
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
5HPHUFLHPHQWV
Je tiens tout d’abord à remercier Madame Monique JOLY, responsable de Doc’INSA, qui m’aaccueilli au sein de son service et m’a permis de participer à ce projet.
Je remercie Monsieur Jean–Marie PINON, professeur de l’INSA et enseignant responsable de monstage, pour son encadrement et ses précieux conseils.
Je remercie particulièrement Jean–Michel MERMET, webmestre et responsable de l’interface ducatalogue informatisé de Doc’INSA (entre ses nombreuses casquettes) ; tuteur de mon stage, pourm’avoir apporté la rigueur qui me fit parfois défaut, et pour ses conseils lucides et pertinents.
Je remercie tous les membres de l’équipe ‘thèses’ d’avoir, au fil de nos réunions de travail, planté ledécor complet de ce projet et de m’avoir ainsi apporté une vision globale sur ledit projet.
Je remercie sincèrement tout le personnel de Doc’INSA pour sa sympathie à l’égard du nouveauvenu que j’étais dans le bureau des hommes… et pour m’avoir fait apprécier l’envers du décord’une bibliothèque.
A l’issue de trois agréables années au sein du département informatique de l’INSA de Lyon,j’adresse des remerciements particuliers à Monsieur Yves MARTINEZ, directeur du département,pour le dynamisme de ce département d’études, à Jacqueline MARTINEZ et Odile CLEMENT pourleur gentillesse et leur efficacité, et à toute l’équipe enseignante pour la qualité de l'enseignementqui nous a été dispensé.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
6RPPDLUH
1 Contexte .......................................................................................................5
1.1 Présentation générale de Doc’INSA...............................................5
1.1.1 Les thèses de l’INSA...................................................................5
1.1.2 Objectifs du projet........................................................................5
1.1.3 Méthode suivie.............................................................................5
1.1.4 Déroulement du projet.................................................................6
1.2 Etat de l’art .......................................................................................7
1.2.1 Outils de l’édition électronique ....................................................7
1.2.1.1 Coexistence de formats ..........................................................7
1.2.1.2 Langages de description de page ..........................................7
1.2.2 Serveurs de thèses existant........................................................9
1.2.2.1 Le NDLTD................................................................................9
1.2.2.2 Les projets comparables au NDLTD......................................9
1.2.2.3 UMI...........................................................................................9
1.2.2.4 Open Library Network OBN (Réseau PICA)..........................9
1.2.2.5 Nature, nombre et format des documents ...........................10
2 Choix techniques .......................................................................................13
3 Présentation d’Adobe Acrobat ..................................................................14
3.1 Le format PDF ...............................................................................14
3.2 PDFMaker......................................................................................14
3.3 PDFMark........................................................................................14
3.3.1 L'opérateur pdfmark ..................................................................15
3.3.2 Repères (OUT) ..........................................................................16
3.3.3 Définition de liens.......................................................................17
3.4 Acrobat Distiller..............................................................................17
3.5 Acrobat Exchange.........................................................................18
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
3.6 Acrobat Reader..............................................................................18
4 Format des documents électroniques......................................................19
4.1 Règles d’édition .............................................................................19
4.2 Schémas des liens hypertexte......................................................19
4.2.1 Repères entre les documents constituant la thèse..................20
4.2.2 Navigation dans chaque chapitre à l'aide des repères............21
4.2.3 Autres liens au sein d'un document..........................................22
5 La chaîne d’édition numérique..................................................................23
5.1 Fonctionnement.............................................................................23
5.2 Aperçu de l’interface......................................................................25
Le guide de conversion..............................................................................27
6 Résultats obtenus - Le projet CITHER.....................................................28
7 Conclusion..................................................................................................29
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
� 7DEOH�GHV�LOOXVWUDWLRQV
• Figure 1 : Liens et hyperliens – repères entre les fichiers ...............................20
• Figure 2 : Liens et hyperliens – Repères dans le même fichier ......................21
• Figure 3 : Autres liens dans les documents .....................................................22
• Figure 4 : Opérations de la chaîne d'édition.....................................................23
• Figure 5 : Fenêtre principale de l'application CEN...........................................25
• Figure 6 : Propriétés d'un document - Extrait de la fenêtre principale ............26
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
� &RQWH[WH
��� 3UpVHQWDWLRQ JpQpUDOH GH'RF·,16$
Doc'INSA, Bibliothèque scientifique et technique de l’INSA de Lyon, propose un ensemble deprestations destiné aux étudiants, enseignants, chercheurs et, de façon plus générale, à tout lepersonnel de l'INSA de Lyon. Les personnes extérieures à l'INSA peuvent également s’y inscrire.
Doc'INSA dispose de 85 000 ouvrages, 1 740 collections de périodiques et 2 700 microformes,spécialisés en sciences de l’ingénieur.
1800 thèses peuvent être consultées ou empruntées à Doc’INSA.
����� /HV WKqVHV GH O·,16$
Doc’INSA est dépositaire officiel des thèses produites dans les laboratoires de l’INSA, et reçoit dece fait environ 130 documents de ce type chaque année.
Afin d’élargir la diffusion de ces documents, Doc’INSA a souhaité mettre en place un serveur dethèses en texte intégral, sur Internet.
En supposant que la quasi totalité de ces documents puisse être publiée sur Internet (accord del’auteur, non confidentialité du mémoire), le volume de données à traiter est conséquent (une thèseà traiter tous les deux jours – en moyenne). Il convenait donc de mettre en place des procédures etde développer des outils efficaces et d’un usage pratique.
Les documents électroniques devaient également être accessibles facilement : l’interface WWWdevait permettre la recherche de documents par sujet ou par auteur, par année, proposer deslistes…
����� 2EMHFWLIV GX SURMHW
La partie du projet 'thèses' (qui est aujourd'hui devenu le projet CITHER1) couverte par mon PFEétait à l'origine la conception et la réalisation (totale ou partielle) du service (production desdocuments et interface de consultation), et ce en collaboration avec Jean-Michel MERMET(webmestre du site de Doc'INSA, et de la recherche dans l'opac2).
Le but à atteindre était la mise en place d'un service opérationnel à la fin du stage.
����� 0pWKRGH VXLYLH
La conception du service et de la chaîne de production des documents s'est appuyée sur UMLi. Lesystème à concevoir ne s'appuyant pas sur des modèles complexes, la méthode n'a pas étéappliquée à tous les niveaux de conception. En revanche, elle a présenté l'avantage d'unformalisme relativement aisé à comprendre pour tous les acteurs du projet.
1 Consultation en texte Intégral de THèses En Réseau2 Les ouvrages de Doc'INSA ne sont pas en accès direct : il est donc indispensable d'en rechercher la cote dans la base dedonnées de la bibliothèque.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
����� 'pURXOHPHQW GX SURMHW
A mi-parcours, mon projet de fin d'études a été recentré sur la chaîne d'édition des documentsnumériques (au vu des résultats de l'étude préalable). La partie FrontOffice a été réalisée par Jean-Michel MERMET, avec ma participation ponctuelle au niveau de certaines pages générées par lachaîne d'édition.
L'étude détaillée a débouché sur la réalisation d'un prototype, lequel est devenu une applicationpouvant encore être améliorée, mais fiabilisée et testée en production durant la fin de mon stage.
Toute la documentation de conception du projet CITHER est disponible sur le site Internet deDoc'INSA.
Doc'INSA envisage la possibilité de distribuer librement l'application aux bibliothèques intéressées.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
��� (WDW GH O·DUW
En préambule à la phase de conception du service, j’ai établi un état de l’art en matière debibliothèque électronique (ou virtuelle), dans le cas des thèses ou mémoires de doctorat.
Cet état de l’art a été établi suivant deux grands axes : les outils de l’édition électronique et lesservices existants.
����� 2XWLOV GH O·pGLWLRQ pOHFWURQLTXH
La publication d’un document par voie numérique implique d’adopter un format de document. Eneffet, les informations d’aspect (corps de texte, police, marges, etc.) sont interprétées par le logicielde lecture qui reconstitue l’aspect du document.
Plusieurs solutions existent ou sont en cours de développement. Elles sont pour la plupartincompatibles entre elles.
1.2.1.1 Coexistence de formats
L’arrivée des technologies numériques soulève la question de la pertinence de conserver uneversion papier. En effet, si le document est édité directement au format numérique, et n’est pas lanumérisation d’un ouvrage existant, quelle doit être la version à considérer comme ‘mère’ ?
Dans le cas de la bibliothèque américaine (NDLTDii), le support papier disparaît, et s’il estéventuellement demandé par les départements d’étude, il est refusé par la bibliothèque (quirefusera même de numériser un document imprimé).
La version numérique d’un document peut remplacer avantageusement une épreuve imprimée. Ilimporte cependant de s’assurer que l’on disposera des outils pour lire ces supports modernes…dans quelques décennies.
Afin de permettre plus de souplesse lors de la consultation des documents, il peut être judicieux deproposer plus d’un format au lecteur. Un de ces formats pourra représenter le meilleur des supportsconnus (par exemple un fichier Acrobat), un second ne nécessitera aucun module supplémentairepar rapport aux «butineurs» Internet standard (un format HTML simple, voire un Texte ASCII parexemple).
1.2.1.2 Langages de description de page
La publication de documents scientifiques peut impliquer certaines contraintes : présence d’images,de graphiques, d’équations, document de taille importante, etc. Le format cible devait donc êtreadapté à ces contraintes, facile à mettre en œuvre, et suffisamment répandu pour que lesdocuments soient consultable sur la plupart des plates-formes.
Les langages permettant de décrire un document ne manquent pas (HTML3, SGML4, XML5…).Conçus dans des buts différents, ils présentent chacun des avantages et des inconvénients. Ainsi,si SGML semble - au premier abord - idéal pour la publication de documents scientifiques, sa miseen œuvre reste très lourde, en l’absence d’outils intégrés. De plus, il n’existe pas à ce jour deprogramme – gratuit - permettant de visualiser facilement un document SGML en ligne.
3 HyperText Markup Language4 Standard Generalized Markup Language5 Extensible Markup Language
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
Le langage HTML, qui ne nécessite pas d’autre programme de visualisation qu’un butineur Internetclassique, est malheureusement peu adapté à la représentation de gros documents scientifiques(pagination difficile, impossibilité de représenter des équations…). Les versions futures de HTMLpallieront peut-être à ces manques.
Le format PostScript est rencontré sur de nombreux serveurs Internet pour la diffusion dedocuments ‘complexes’ (mémoires, manuels). Cependant, ce format n’est pas adapté à la lectureen ligne : il est encombrant et est conçu pour piloter une imprimante - et non pour être affiché àl’écran.
L’étude de l’état de l’art a rapidement montré la quasi-unanimité existant autour du format PDF6 del’éditeur Adobe. Basé sur le langage PostScript, ce langage est adapté à la consultation en ligne dedocuments de taille importante, pouvant contenir des images haute résolution et des donnéesmultimédia, il permet de définir des hyperliens (au sein d’un fichier ou vers d’autres fichiers), desrepères (sorte de table des matières de liens hypertexte), et il peut être ‘optimisé’ afin d’êtreconsultable page par page. Enfin, le document peut être protégé contre l’impression, le copier-coller, la modification.
Le programme d’affichage des fichiers PDF, Acrobat Reader, est gratuit et disponible sur la plupartdes plates-formes. Par ailleurs, le format PDF est un format documenté ce qui lui assure unecertaine pérennité.
En revanche, le format PDF est un langage de représentation de page, impropre à l’archivage : Necomprenant pas la notion de structure logique de document (paragraphes, titres, etc.), il ne peutefficacement servir de source à une éventuelle conversion vers un nouveau format. Une solutiond’archivage des documents source (fournis par l’auteur et éventuellement retouchés sur le posted’édition) a donc été retenue, en attendant l’adoption future d’un format tel que SGML ou XML dansle cadre de ce même projet.
Sur le site Internet d’Adobe Systems, une pageiii répertorie les sites Internet universitairesproposant des documents au format PDF.
6 Portable Document Format
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
����� 6HUYHXUV GH WKqVHV H[LVWDQW
Les services existant et proposant un accès à des thèses (ou mémoires de doctorat)«électroniques» présentent un ensemble de caractéristiques (aspect, accès aux documents, formatde documents) qu’il est intéressant de comparer.
Les services rencontrés et qui seront comparés ci-après sont les suivants :
1.2.2.1 Le NDLTD
Aux Etats-Unis, un projet baptisé The Networked Digital Library of Theses and Dissertationsii (ouNDLTD) a été initié au début des années 90. Paradoxalement, l’intérêt affiché de ce programme –consistant principalement à mettre des thèses à disposition des internautes – n’est pas tant depermettre l’accès à ces thèses que d’enseigner aux étudiants concernés les bases de ladocumentation électronique. Un accès facilité aux thèses et une économie de stockage papiercomptent bien sûr parmi leurs objectifs.
Le principal acteur (en tant que bibliothèque) de ce projet est l’université d’état de Virginie iv, quipropose un serveur de thèses à l’aspect simplev. D’autres universités participent à ce projet etcertaines proposent d’ores et déjà des thèses ; parmi elles, l’université d’état de Caroline vi
propose actuellement trois thèses au format Acrobatvii.
1.2.2.2 Les projets comparables au NDLTD
En marge du projet précédent (mais appelées à le rejoindre), d’autres universités proposent desthèses électroniques via Internet. Ainsi, l’université de Waterloo viii (Canada) dispose d’un serveurde thèses, ainsi que l’université de l’université du Michigan ix.
Ces deux services sont, à cette date, au stade expérimental : dans le cas de l’université deWaterloo, le service propose une liste d’une quinzaine de thèses classées par auteur. Dans leMichigan, ce sont 4 thèses qui sont accessibles par mot clé, année, auteur, etc.
Les universités de Toronto et de York x se sont associées pour étudier un projet comparable.
1.2.2.3 UMI
UMI propose un servicexi (payant) permettant aux auteurs de soumettre leurs thèses, et auxchercheurs de commander les ouvrages les intéressant.
Les résumés des thèses sont disponibles en-ligne, et les fichiers PDF (quand ils existent) peuventêtre téléchargés moyennant finance.
1.2.2.4 Open Library Network OBN (Réseau PICA)
OBNxii réalise l’intégration de plusieurs systèmes existants. Il permet d’effectuer des recherches àl’aide de catalogues situés au Pays-Bas.
Le service WebCAT est un de ces catalogues. Ce service expérimental permet d’accéder à desdocuments en texte intégral.
Le réseau OBN demande une identification (login) de la part de l’utilisateur. Les recherches que j’aipu consulter sont des versions de démonstration.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
1.2.2.5 Nature, nombre et format des documents
1.2.2.5.1 Nature des documents proposésLes bibliothèques électroniques peuvent proposer virtuellement tout document (grâce auxpossibilités du multimédia), ce qui peut inclure des objets ou des séquences extraites de films.Cependant, l’usage est aux documents simplement composés de texte et d’image. La raison en estsimple : le support «cible» du rédacteur est encore le papier dans la plupart des cas.
Les services comparés proposent des thèses. Une thèse peut être un simple texte structuré, mais ilest bien rare que celui-ci ne soit accompagné d’illustrations. Celles-ci peuvent aller du simpleschéma noir et blanc à la photographie (images issues d’observations). Il est probable que lespossibilités du support multimédia donne l’idée aux auteurs d’ajouter des séquences vidéo ousonores à leur travail.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
1.2.2.5.2 Etat et possibilités des services visitésChiffres et caractéristiques relevés le 19 juin 1998.
Organisme Nature des
documents
Nbre. Format Accès à l’information
Digital Library of ETDs
(Université de Virginie)Thèses
Mémoires
830 Résumés en HTML,
documents en PDF
Recherche : (sur les
résumés et le titre), par
OpenText (phrase, mots
clés) ou Dienst (non
opérant au 18/12/97)
Liste : par auteur, liste des
documents récents
UMI ProQuest Digital Dissertations
Pilot Site
(Service expérimental)
Thèses
Mémoires
>100 Résumés en HTML,
documents en PDF
Recherche : par mots clés
(sur les résumés et le
titre), par auteur, par école
Liste : par sujet ou école
NCSU Libraries
(Université de Caroline)Thèses et
mémoires
12 Résumés en HTML,
documents en PDF
Liste : apparemment non
classée
UW Electronic theses and
dissertations
(Université de Waterloo)
Thèses et
mémoires
17 Résumés en HTML,
documents en PDF
Recherche : sur les
résumés, par mots clés,
restriction possible sur
l’auteur, la matière ou
l’école
University of Michigan Dissertations
and Thesis library
(Université du Michigan)
Mémoires 4 SGML (4) et HTML (1) Recherche : par mots clés
en texte intégral ou sur le
résumé, par auteur,
responsable, numéro UMI,
année, sujet, citation
bibliographique…
Liste : par auteur, sujet ou
année
Recherche inopérante au
12/12/97
The Joint Electronic Thesis and
Dissertation Project (…)
(universités de Toronto et de York)
Thèses et
mémoires
0 - -
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
1.2.2.5.3 A propos des formatsDans le cadre du projet américain du LDLTDii, le choix de publier les thèses au format PDF a étéfait en 1993. Ce choix est présenté comme temporaire, et semble appelé à évoluer vers une autresolution plus souple, langage de type description de pages et lié aux fichiers image (ou vidéo)extérieurs.
Les thèses disponibles sur le serveur de Virginia Tech. ont été converties en PDF (Adobe Acrobat)par les étudiants, suivant un protocole exposé par l’université. Elles n’exploitent pas toutes lespossibilités de ce format (liens, liste de repères, optimisation pour la consultation en ligne…), maisil faut leur reconnaître un aspect indéniablement plus propre que celui de pages HTML ‘classiques’.
UMI proposera prochainement ses documents en texte intégral. Le site «pilote» propose un accèslibre à quelques documents au format PDF.
L’université du Michigan a adopté une autre direction, et propose ses documents en double formatHTML / SGML, ou bien exclusivement en SGML .
Le format PDF d’Adobe semble donc être adopté dans le milieu de l’édition électronique.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
� &KRL[�WHFKQLTXHV
Au vu de l'état de l'art, nous avons fait un certain nombre de choix techniques :
• Adoption de PDF pour la représentation des documents (choix pouvant être remis en questionà moyen terme, suivant les évolutions des langages tels que XML),
• Utilisation de l'application Doris Web (déjà utilisée pour l'opac) pour la recherche des thèsesnumérisées,
• Présence, pour chaque thèse, d'un "Pont d'embarquement", page HTML reprenant la noticebibliographique de la thèse, contenant les liens vers les fichiers PDF, et pouvant être indexéepar un moteur de recherches (tel Altavista),
• Adoption de Word comme source privilégiée (importation possible des documents édités sousd'autres traitements de texte) ; les documents rédigés en TEX seront convertis en PostScriptpar leurs auteurs, si possible suivant quelques consignes simples.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
� 3UpVHQWDWLRQ�G·$GREH�$FUREDW
��� /H IRUPDW 3')
Le format PDF est un langage de description de page. Comparable dans une certaine mesure auformat PostScript (dont il est issu : il en reprend le modèle de représentation), il permet dereprésenter des pages complexes (graphiques, mise en page, polices de caractères) telles qu’ellesont été conçues.
Ce format présente d’importants avantages sur PostScript : il est beaucoup plus « léger »(compression des données), il est adapté à la lecture en-ligne (téléchargement page par page,logiciel de visualisation Acrobat Reader disponible sur la quasi-totalité des plates-formes), il peutcomporter des liens hypertexte.
Enfin, il peut comporter des images haute résolution (que le lecteur peut visualiser minutieusementà l’aide de la fonction ‘zoom’ d’Acrobat Reader), et même des séquences multimédia (sonoreset/ou visuelles).
Le format PDF est en outre complètement documenté, gage de pérennité. Cette documentation estdisponible en lignexiii.
Seuls les outils de la suite Acrobat utilisés pour ce projet sont présentés ici.
��� 3')0DNHU
Adobe a développé une macrocommande Word, nommée PDFMaker, qui permet la création defichiers PDF de grande qualité à partir de Word 97.
Le principe de cette macro est de créer un fichier PostScript enrichi de commandes pdfmark,commandes générées automatiquement à partir de la structure du document Word.
Ce programme peut ainsi générer des liens PDF vers les notes de fin ou de bas de page, depuis lesommaire, depuis les URL détectées dans le texte ; il peut en outre générer des repères PDF pourtous les titres rencontrés.
Si un document Word a été rédigé en utilisant les styles de titre, le sommaire et les notes Word, ilpourra être converti via PDFMaker en un fichier PDF « riche ».
/D YHUVLRQ DFWXHOOH GH 3')0DNHU HVW DGDSWpH DX[ YHUVLRQV DQJOR�VD[RQQHV GH :RUG� -H O¶DL OpJqUHPHQWPRGLILpH SRXU TX¶HOOH GpWHFWH OHV QRP GH FKDPSV VRPPDLUH G¶XQ GRFXPHQW IUDQoDLV� M¶DL pJDOHPHQW UHQGXFRQGLWLRQQHOOH OD FRQYHUVLRQ GX ILFKLHU 3RVW6FULSW HQ 3') �YRLU OH PDQXHO WHFKQLTXH��
��� 3')0DUN
Un fichier PostScript « normal » ne comprend aucune information de structure, aucun lienhypertexte ou aucun repérage.
Les fichiers PostScript peuvent facilement être convertis en PDF via Acrobat Distiller. Adobe a doncintégré à PostScript un nouvel opérateur, l’opérateur pdfmark), qui permet d’ajouter au fichiersource PostScript des consignes de conversion (interprétées par Distiller).
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
L’opérateur pdfmark obéit à une syntaxe définie dans le "pdfmark Reference Manualxiv" rédigé parAdobe. Cette partie décrit brièvement les opérateurs qui sont utilisés par l'application.
,O HVW LPSRUWDQW� SRXU OD FRPSUpKHQVLRQ GHV V\QWD[HV SGIPDUN� GH FRQQDvWUH OH SULQFLSH GH QXPpURWDWLRQGHV SDJHV GXQ ILFKLHU 3') �
� 3') QH FRQQDvW SDV OH QXPpUR TXL DSSDUDvW pYHQWXHOOHPHQW VXU XQH SDJH� /HV SDJHV VRQW QXPpURWpHV HQVpTXHQFH � OD SUHPLqUH SDJH HVW OD SDJH QXPpUR �� /HV QXPpURV GH SDJH XWLOLVpV SDU SGIPDUN VRQW GRQFFHV QXPpURV VpTXHQWLHOV�
����� /RSpUDWHXU SGIPDUN
L'opérateur pdfmark prend pour arguments un objet mark, un nombre variable de paires clé-valeur, et un objet nom.
La syntaxe générale de l'opérateur pdfmark est la suivante :
[…paires clé-valeur…
TYPE pdfmark
TYPE est un nom définissant le type d'opérateur pdfmark .
Afin que les imprimantes ne supportant pas la syntaxe pdfmark puissent gérer correctement lesfichiers PostScript ainsi modifiés, il convient d'ajouter le code suivant en en-tête du fichier PS :
/pdfmark where{pop} {userdict /pdfmark /cleartomark load put} ifelse
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
����� 5HSqUHV �287�
Un repère (bookmark ou outline entry suivant la désignation d'origine) est décrit par l'opérateurpdfmark et le nom OUT.
La syntaxe est la suivante :
[ /Title string/Count int…Action-specifying key–value pairs…/OUT pdfmark
Clé Type Sémantique
Title Chaîne (Obligatoire) Libellé du repère. Limité (sic) à 65.535 caractères, maximumconseillé : 32 caractères afin d'être facilement lisible avec Acrobat Reader.
Count Entier (Optionnel) Définit le nombre et l'apparence des repères "fils". Pour plusde détails consulter la documentation d'Adobe.
• 7DEOHDX � � $WWULEXWV GHV UHSqUHV
Le lien doit de plus contenir des paires clé-valeur spécifiant l'action associée au lien (voir ci-après).
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
����� 'pILQLWLRQ GH OLHQV
PDF utilise trois méthodes pour définir les événements associés à un repère (l'ouverture d'unfichier, etc.) : les vues, les actions et les destinations nommées.
Les Vues spécifient un emplacement dans le fichier courant.
Clé Type Sémantique
Action Nom oudictionnaire
Définit le type d'action. Doit être un nom prédéfini ou un dictionnaire décrivantl'action.
• S'il s'agit d'un nom :
GoTo : Va à une page spécifiée, au facteur d'agrandissement demandé.
GoToR : Ouvre un autre document à la page et au facteurd'agrandissement demandés.
Launch : Ouvre un document ou une application.
Article : Saute à un article.
• Les dictionnaires définissant une action sont généralement utilisés pouractiver des plug-ins.
Dest Nom, entier, ouchaîne
Article ou destination nommée. S'il s'agit d'une destination, elle doitcorrespondre à une destination définie avec le type DEST.
• 7DEOHDX � � 7\SHV GDFWLRQV
��� $FUREDW'LVWLOOHU
Acrobat Distiller est l’élément de la suite Acrobat qui convertit un fichier PostScript (.PS) en fichierAcrobat (.PDF).
Cette application est paramétrable : les paramètres de compression, de sous échantillonnage desimages, d’inclusion des polices, etc.… sont accessibles à l’utilisateur. Toutes ces options sontinscrites dans un fichier .INI, éventuellement modifiable par une autre application.
Si le fichier source PostScript contient des commandes pdfmark, Distiller génère les hyperliens,repères, et informations PDF. En revanche, Distiller ne sait pas générer les miniatures de pages.Cette tâche doit être confiée à Exchange.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
��� $FUREDW ([FKDQJH
Acrobat Exchange est (comme son nom le laisse supposer) l’application principale de la suiteAcrobat. Si un fichier doit être modifié, édité, enrichi, cette opération se fait dans Exchange.
Exchange permet de créer et modifier les repères Acrobat, les liens, les vues miniatures. Il permetégalement d’optimiser les fichiers PDF et de définir les options de protection.
Ces deux dernières fonctions sont disponibles via l’API Exchangexvi, API qui permet de piloterExchange via des mécanismes OLE.
Echange permet également le travail de groupe sur des fichiers PDF (échange de notes).
��� $FUREDW5HDGHU
Reader est le logiciel (gratuit) qui permet l’affichage des fichiers PDF sur l’écran. Reader s’intègreaux butineurs Internet les plus répandus (Netscape et Explorer). Il permet l’affichage des PDF etleur lecture à l’écran.
Si ces opérations n’ont pas été interdites par l’éditeur, il permet également le copier-coller du texteet des graphiques, et l’impression du document.
Acrobat Reader est disponible sur Internet ; le format PDF peut donc être utilisé sur un site Websans risque que l’utilisateur soit dans l’impossibilité de le lire.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
� )RUPDW�GHV�GRFXPHQWV�pOHFWURQLTXHV
Le résultat de la chaîne d’édition est un document électronique publiable. Cette partie traite de cesdocuments (forme, caractéristiques).
��� 5qJOHV G·pGLWLRQ
Les documents électroniques produits dans le cadre du projet "thèse" de Doc'INSA seront mis àdisposition d'un large lectorat. Le nombre de document proposés par ce service grossirarapidement (+150/an dès le début), et il est important que ces documents présentent une certainecohérence.
Cette cohérence apportera aux lecteurs un confort de consultation. Du point de vue de l'opérateureffectuant la conversion du document original en document électronique, ces règles seront commeles points d'une procédure standard, guidant ainsi les opérations. Enfin, dans le cas du retraitement(correction) d'un document électronique, ou d'un remaniement du service, cette cohérence faciliterale travail des opérateurs.
/HV UqJOHV G¶pGLWLRQ VRQW SULQFLSDOHPHQW GHV SDUDPpWUDJHV G¶$FUREDW� /H GpFRXSDJH HQ ILFKLHUV� ODFRPSUHVVLRQ GHV LPDJHV� O¶pFKDQWLOORQQDJH GHV SROLFHV GH FDUDFWqUHV� O¶DVSHFW GHV OLHQV� OHV PpWDGRQQpHV3')� HWF� VRQW VSpFLILpHV GDQV XQ GRFXPHQW LQFOXV HQ DQQH[H �5qJOHV G¶pGLWLRQ pOHFWURQLTXH�
��� 6FKpPDVGHV OLHQV K\SHUWH[WH
Les fichiers PDF produits par la chaîne d’édition comportent des liens hypertexte. Ceux-ci sontgénérés automatiquement, d’après les informations contenues dans les fichiers sources. Parconséquent, la création de ces liens dépend de la « richesse » du document source (utilisation desstyles de titre, etc.).
/HV VFKpPDV FL�DSUqV UHSUpVHQWHQW OH FDV LGpDO G¶XQ GRFXPHQW FRPSRUWDQW WRXV OHV W\SHV GH OLHQV�
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
����� 5HSqUHV HQWUH OHV GRFXPHQWV FRQVWLWXDQW OD WKqVH
Les différents fichiers PDF constituant une même thèse ont en commun le premier niveauhiérarchique des repères, chaque étiquette de ce niveau correspondant à un fichier PDF.
Ainsi, la navigation entre ces fichiers est transparente pour l'utilisateur.
Légende des l iens :
Titre etremerciements
Titre et remerciements Sommaire 1. Chapitre 1 2. Chapitre 2 (...) Annexes
"Repères"
Sommaire
Sommaire 1. Chapitre 1 1.1 Paragraphe 1 1.2 paragraphe 2 2. Chapitre 2 2.1 (...)
"Repères"
Chapitre 1
Titre et remerciements Sommaire
� 1. Chapitre 1 1.1 Paragraphe 1.2 Paragraphe 2. Chapitre 2 (...) Annexes
"Repères"
Chapitre 2
"Repères"
Annexes
"Repères"
Chapitre 1
blablablablablablablablablablablablalablablablahhh......
Repère ouvrant un f ichier
• )LJXUH � � /LHQV HW K\SHUOLHQV ± UHSqUHV HQWUH OHV ILFKLHUV
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
����� 1DYLJDWLRQ GDQV FKDTXH FKDSLWUH j ODLGH GHV UHSqUHV
La structure logique de chaque chapitre est reprise en détail par les repères Acrobat. Ainsi, lahiérarchie des titre y est reprise et un clic sur un repère "saute" au texte correspondant.
Chapitre 1
Titre et remerciements Sommaire
� 1. Chapitre 1 1.1 Paragraphe 1.2 Paragraphe 2. Chapitre 2 (...) Annexes
"Repères"
Chapitre 1
blablablablablablablablablablablablalablablablahhh......
• )LJXUH � � /LHQV HW K\SHUOLHQV ± 5HSqUHV GDQV OH PrPH ILFKLHU
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
����� $XWUHV OLHQV DX VHLQ GXQ GRFXPHQW
D'autres liens sont générés automatiquement lors de la conversion au format PDF : les renvois auxnotes de fin ou de bas de page sont "sensibles" et renvoient aux libellés correspondant. Lesadresses Internet (URL) sont également converties en liens accédant à l'adresse à l'aide duprogramme approprié.
Les lignes du Sommaire sont converties en autant de liens vers le titre correspondant (dans le casou la source est constituée d’un seul fichier Word ou PS – convenablement structuré).
* : Blah blah blah blah blahblah blah blah blah.. .
Blah blah blah blah blahblah blah blah blah1 b lahblah blah blah blah blah blahblah bla ht tp: / /www.blah.netblah blah blah* b lah b lahblah blah blah blah blah . . .
1 : Blah blah blah.. .
Note debas de page
Notede f in
AdresseInternet
• )LJXUH � � $XWUHV OLHQV GDQV OHV GRFXPHQWV
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
� /D�FKDvQH�G·pGLWLRQ�QXPpULTXH
��� )RQFWLRQQHPHQW
L’application principale a été baptisée CEN (Chaîne d’édition numérique). Cet outil permet lamanipulation de projets d’édition, projets rassemblant un ensemble de fichiers source qui seronttraités par lot.
Un projet, au sens de l’application décrite, rassemble plusieurs attributs :
� des informations générales sur le document (Auteur, Titre, Date, Mots-clés),
� un ensemble de fichiers source, chacun d’entre-eux ayant en outre un titre (titre de la partiequ’il représente) et un numéro d’ordre dans le document,
� un ensemble éventuel de documents numérisés en sus, à intégrer à la thèse et à archiver avecle reste.
L’application pilote Word, Acrobat Distiller et Exchange7, et modifie par ailleurs directement unepartie des fichiers.
:RUG
3')
+70/
,PDJHV� SDJHV«
3') 3XEOLDEOH
c
d e
f
3RVW6FULSW 3RVW6FULSW
+ Liens inter-documents
3RVW6FULSW
+ Liens intra-document
• )LJXUH � � 2SpUDWLRQV GH OD FKDvQH GpGLWLRQ
La conversion se déroule en quatre étapes (dont les numéros sont repérés sur la Figure 4).
7 Acrobat Distiller et Exchange font partie de la suite Acrobat d’Adobe.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
c Tout d’abord, la macrocommande Word (Adobe PDFMakerxv, légèrement modifiée) crée unfichier PostScript enrichi d’instructions pdfmark à l’intention d’Acrobat Distiller. Cettemacrocommande crée (le cas échéant) des liens à partir des champs ‘note’, ‘table’, etc. Elle créeégalement un repère Acrobat pour chaque titre.
d Les fichiers PostScript obtenus sont alors directement modifiés par l’application qui y ajoute desrepères (toujours via pdfmark) désignant les autres fichiers. Il devient alors possible de parcourirtoute une thèse sans se soucier de son découpage éventuel en plusieurs fichiers PDF.
e Les fichiers PostScript sont ensuite convertis en PDF par Distiller.
f Enfin, les fichiers PDF sont ‘retraités’ à l’aide d’Exchange : leurs champs titre, sujet, auteur…sont renseignés ; les miniatures de pages sont créées et les fichiers optimisés pour une lecture enligne (opération permettant au serveur d’envoyer le document page à page).
Dans le cas où les fichiers fournis par l’auteur sont de format PostScript, la première étape (Word)est ignorée.
A ce point, le traitement par lot est terminé, et un rapport de conversion a été généré.
L’application génère en outre un ‘pont d’embarquement’ vers la thèse, page HTML rassemblant laréférence bibliographique du document et des liens vers tous les fichiers PDF. Enfin, elle peutpréparer les fichiers à un archivage en les rassemblant dans un répertoire.
L’opérateur peut facilement modifier les fichiers (source ou produits) depuis l’application (appel deWord ou d’Acrobat Exchange). Il peut ainsi vérifier la forme des documents Word, ou ajouter deséléments non numérisés ou des séquences multimédia aux fichiers PDF.
Cette application programmée en Delphi 3 dans l’environnement Windows contrôle les autresapplications via plusieurs mécanismes : Word et Exchangexvi sont pilotés via COM/OLE8, alors queDistillerxvii est contrôlé par des messages Windows9.
/¶DSSOLFDWLRQ UHSURGXLW OH ORRN IHHO GHV DSSOLFDWLRQ :LQGRZV ���17�� DILQ GH IDFLOLWHU VRQ XWLOLVDWLRQ�
8 Common Object Model / Object Link Embedding : modèle objet de Windows.9 Mécanisme de base de communication entre les entités de Windows
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
��� $SHUoXGH O·LQWHUIDFH
• )LJXUH � � )HQrWUH SULQFLSDOH GH ODSSOLFDWLRQ &(1
La fenêtre principale de l’application CEN rassemble plusieurs éléments :
� Une barre de menus et une barre d’outils, donnant accès aux commandes,
� Une petite arborescence donnant accès aux fichiers du projet,
� La liste des fichiers du projet, ou la liste des caractéristiques du document (voir ci-après),
� Un panneau d’aide contextuelle.
/HV GpWDLOV GH O¶LQWHUIDFH� GHV FRPPDQGHV HW GH OD SURFpGXUH GH FRQYHUVLRQ GRQW GRQQpV GDQV OHPDQXHOGH O·XWLOLVDWHXU �LQFOXV HQ DQQH[H� HW GDQV OH JXLGH GH FRQYHUVLRQ�
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
• )LJXUH � � 3URSULpWpV GXQ GRFXPHQW � ([WUDLW GH OD IHQrWUH SULQFLSDOH
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
��� /H JXLGH GHFRQYHUVLRQ
La seconde application développée pour ce projet est un guide deconversion. Il revêt la forme d’une liste de contrôle dont les pointspeuvent être cochés durant la procédure.
La présence de ce guide de conversion se justifie par le fait que letraitement des documents se fait par lots : Il est important de ne pasomettre d’opération avant de lancer le traitement. Par ailleurs, uncertain nombre d’opérations ne peuvent être automatisées, les API10
des outils Acrobat ne le permettant pas. Ces opérations sontsignalées à l ‘opérateur par le guide de conversion.
Le guide de conversion n’impose pas l’ordre d’exécution des tâches.En revanche, il permet à l’opérateur de retrouver rapidement lesopérations restant à accomplir.
Enfin, le guide de conversion propose un accès facilité aux outils dontpeut avoir besoin l’opérateur : programme de numérisation d’images,programmes de lecture d’archives (les fichiers fournis par les auteursétant souvent compressés), programme de création de cédérom, etc.
Le contenu du guide de conversion doit être facilement modifiable : ilest par conséquent implémenté en HTML.
L’affichage est de forme arborescente : ceci limite l’encombrementdu guide de conversion, et facilite la navigation entre les tâches.
L’opérateur coche une case devant chaque point.
Les points déjà validés sont affichés en bleu (ici : « Création durépertoire… », « Copie des fichiers… », …). L’opérateur peut ainsivérifier rapidement les point manquants.
10 Application Programming Interface
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
� 5pVXOWDWV�REWHQXV���/H�SURMHW�&,7+(5
A l’heure où sont tapées ces lignes, le service CITHER11 est ouvert (à l’adresse :http://csidoc.insa-lyon.fr/these/). Il propose 8 thèses en texte intégral.
La chaîne d’édition fonctionne (elle a servi à produire une partie des thèses disponibles).L’application est stabilisée, elle pourra éventuellement être modifiée ou adaptée.
La macro PDFMaker devrait être mise à jour par Adobe. Si l’API de ce programme est conservée(le contraire serait surprenant), toute nouvelle version pourra être pilotée par la chaîne d’édition.En revanche, il faudra y ajouter quelques lignes si l’on veut pouvoir interdire la conversionautomatique de PS en PDF (appel à Distiller).
Une première version du guide de conversion a été créée, elle sera « affinée » à l’usage. (Ecrit enHTML, il est facilement modifiable).
La base de connaissances n’est pas terminée : le modèle de fiche d’incident existe, mais les fichessaisies ne sont pas indexées. Cette indexation sera possible quand un moteur sera disponible auniveau du réseau ROCAD (indexation de pages HTML produites à partir du modèle).
Enfin : l'application actuelle ne s'appuie pas sur une base de données. Cependant, le format defichier (propriétaire) utilisé pour décrire les projets est simple (type fichier INI de Windows) etdocumenté (manuel technique de l'application). Il sera donc aisé de réaliser une "moulinette" afind'alimenter une base de données.
11 Consultation en texte Intégral des THèses En Réseau
http://csidoc.insa-lyon.fr/these/
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(��
� &RQFOXVLRQ
Le choix du format PDF ayant été fait pour le début du projet thèses, la solution actuelle peutfonctionner plusieurs années. Elle nécessitera probablement quelques aménagements mineurs(adaptation aux nouvelles versions des outils logiciels afin de prendre en compte leursnouveautés), mais devrait permettre la conversion de la plupart des thèses des quelques années àvenir.
La conversion de documents source PostScript (documents créés sous TEX) devra être améliorée(identification de la procédure à suivre afin de générer un fichier PostScript enrichi pour laconversion, puis rédaction de consignes à donner aux rédacteurs).
La procédure d’archivage reste à préciser.
Les consignes de création des fichiers PostScript (pour les auteurs utilisant TEX) restent à rédiger.Leur principe est exposé dans les documents de conception.
Les outils de l’édition de documents XML devraient arriver à maturité rapidement. Ce format pourraconstituer une nouvelle direction pour le projet thèses.
DOC'INSA CHAINE D'EDITION NUMERIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES
5pIpUHQFHV�ELEOLRJUDSKLTXHV
i FOWLER, Martin , UML distilled : applying the standard object modeling language, Martin Fowler with Kendall Scott ;foreword by Grady Booch, Ivar Jacobson and James Rumbaugh . - Reading, Mass. : Addison Wesley Longman , 1997 . - xviii,179 p. . - Addison-Wesley object technology series
ii The Networked Digital Library of Theses and Dissertations , NDLTD Initiative. [On-line] [December 1, 1997].Available on Internet :
iii Adobe Systems incorporated , Adobe Acrobat: PDF Directory: Education. [On-line] [December 1997].Available on Internet :
iv Virginia polytechnic institute and state university , Virginia Tech. [On-line] [November 11, 1997].Available on Internet :
v Virginia polytechnic institute and state university , Digital Library of ETDs. [On-line] [December 9, 1997].Available on Internet :
vi North Carolina State University , NCSU Libraries Information System. [On-line] [October 5, 1997].Available on Internet :
vii Adobe Systems incorporated , Adobe Acrobat. [On-line] [December 1997].Available on Internet :
viii University of Waterloo Electronic Thesis Project Team (ETPT) , UW Electronic Theses and Dissertations Pilot ProjectETD Server. [On-line] [October 7, 1997].Available on Internet :
ix University of Michigan , The University of Michigan Dissertation and Thesis Library. [On-line] [August 26, 1997].Available on Internet :
x Joint Electronic Thesis and Dissertation Project , The Joint Electronic Thesis and Dissertation Project of the Faculty ofInformation Studies at the University of Toronto, University of Toronto Libraries, and York University Libraries. [On-line][November 20, 1997].Available on Internet :
xi UMI Company , UMI ProQuest Digital Dissertations. [On-line]. [December 11, 1997].Available on Internet :
xii Pica, Pica II OBN. [ON-line] [January 8, 1997].Available on internet :
xiii Adobe Systems incorporated , PDF Reference Manual, [November 27, 1996]Available on Internet :
xiv Adobe Developper Support , pdfmark Reference Manual – Technical Note #5150 [July 22, 1997]Available on Internet : xv Adobe Adobe PDFMaker 1.0 for Microsoft Word 97 [On-line] http://www.adobe.com/supportservice/custsupport/LIBRARY/4d9e.htmxvi Adobe Developer Support , Acrobat Viewer Interapplication Communication Support OverviewTechnical Note #5164xvii Adobe Developer Support , Acrobat Distiller Control Interface SpecificationTechnical Note #5158
http://www.ndltd.orghttp://www.adobe.com/prodindex/acrobat/edu.htmlhttp://www.vt.eduhttp://www.theses.orghttp://www.lib.ncsu.eduhttp://www.adobe.com/prodindex/acrobathttp://www.lib.uwaterloo.ca/~uw-etpt/pilot.htmlhttp://dns.hti.umich.edu/misc/diss.example/http://www.fis.utoronto.ca/etdhttp://www.pica.nl/http://wwwlib.umi.com/dissertations/mainhttp://www.adobe.com/supportservice/devrelations/PDFS/TN/PDFSPEC.PDFhttp://www.adobe.com/supportservice/custsupport/LIBRARY/4d9e.htmhttp://www.adobe.com/supportservice/custsupport/LIBRARY/4d9e.htm
CHAINE D'EDITION NUMERIQUE ANNEXE A : MANUEL TECHNIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES
$QQH[HV
$QQH[H�$�²�0DQXHO�7HFKQLTXH
CHAINE D'EDITION NUMERIQUE ANNEXE B : MANUEL DE L’UTILISATEUR
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES
$QQH[H�%���0DQXHO�GH�O·XWLOLVDWHXU
CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
$QQH[H�&���5qJOHV�G·pGLWLRQ�pOHFWURQLTXH
Caractéristique Caractère Forme Alternative Outil
Format defichier
Obligatoire PDF Acrobat
Formatsannexes
Optionnel Tout type de fichier
Découpage enfichierslogiques
Recommandé Un fichier par partie :
• Titre / Introduction(titre.pdf)
• Sommaire(sommaire.pdf)
• Chapitres(chapX.pdf)
• Bibliographie(biblio.pdf)
• Annexes(annexeX.pdf)
Monolithique(un seul fichier)
• (These.pdf)
CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
Caractéristique Caractère Forme Alternative Outil
Propriétés PDF Obligatoire • Titre
• Sujet
• Auteur
Automatique(chaîned'édition)
CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
Caractéristique Caractère Forme Alternative Outil
Moded'affichage àl'ouverture
Recommandé Page & Bookmarks, Premièrepage, "Fit page"
AcrobatDistiller(paramétrageautomatique)
Repères PDF(bookmarks)
Obligatoire Un repère par titre, hiérarchierespectée (Trois niveauxconseillés).
Les parties suivantes doiventapparaître :
TitreSommaireIntroductionChapitre 1 – intitulé 1.1 intitulé…ConclusionBibliographieAnnexe 1 – intitulé…
Un repère par partieprincipale (Titre,sommaire, chapitres,bibliographie, annexes)
Générationautomatique(source TeXou Word avecstyles), ajoutmanuel avecAcrobatExchange
Miniatures PDF Recommandé Génération de toutes lesminiatures de pages
AcrobatExchange
Liens PDF Recommandé Liens :
• Depuis le sommaire
• Vers les notes de bas depage
• Vers les notes de fin
• Liens Internet
Sous-ensemble de la listeprécédente
Générationautomatique,et/ouExchange
Affichage desliens PDF
Fortementrecommandé
Liens invisibles, s'inversant àla sélection
Tout autre paramétrage AcrobatDistiller(paramétrageautomatique)
CHAINE D'EDITION NUMERIQUE ANNEXE C : REGLES D’EDITION ELECTRONIQUE
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES 3$*(�
Caractéristique Caractère Forme Alternative Outil
Protection PDF Obligatoire Protection contre lamodification
Protectionssupplémentairesenvisageables
AcrobatExchange
Optimisation duPDF
Obligatoire Le fichier est "optimisé"(réduction de sa taille,marquage pour le"byteserving" – visualisationpar page)
AcrobatExchange
Index AcrobatCatalog 12
Recommandé Un index nommé index.pdxest attribué a tous les fichiers
AcrobatCatalog /Exchange
Choix decompressiondes images(PDF)
Recommandé • Compression du fichier :OUI
• Images couleur / niveauxde gris :Pas de réduction(downsampling),Compression manuelleZIP (4 bits)
• Monochrome :Pas de réduction,compression manuelleCCITT Gpe. 4.
AcrobatDistiller(paramétrageautomatique)
Autres optionsPDF
Fortementrecommandé
• Compatible Acrobat 3.0
• Polices incorporées,"subset" en-dessous de25%
• Modèle RGB
AcrobatDistiller(paramétrageautomatique)
12 Cet index n’est pas directement exploitable à la lecture en-ligne, cependant, il pourra ultérieurement être lu par un serveurde recherches tel qu’AltaVista ou Index Server.
CHAINE D'EDITION NUMERIQUE ANNEXE D : DOCUMENTS DU PROJET
0$5&�(7,(11(+81($8 RAPPORT DE PROJET DE FIN D’ETUDES
$QQH[H�'�²�'RFXPHQWV�GX�SURMHW
Documents de gestion de projet
� Dossier d’initialisation
Document marquant le début du projet, présentation des méthodes et outils choisis, del’organisation du projet
� Dossier de bilan
Document clôturant le projet, listant les objectifs atteints et les résultats
Documents de conception
� Note de synthèse – Etat de l’art
Etat de l’art des bibliothèques électroniques de thèses et des outils de l’édition électronique
� Dossier d’étude préalable
Etude générale du sujet
� Dossier d’étude détaillée
Conception des outils à réaliser
Documentation de l’application
� Manuel de l’utilisateur
Référence des commandes et options de l’application
� Manuel technique
Guide du développeur
Rapports de Projet de Fin d’Etudes
� Rapport de synthèse
Article de synthèse présentant le projet
� Rapport de PFE
Le présent rapport
http://csidoc.insa-lyon.fr/these/doc/dossier_initialisation.pdfhttp://csidoc.insa-lyon.fr/these/doc/recherche_bibliographique.pdfhttp://csidoc.insa-lyon.fr/these/doc/rapport_prealable.pdfhttp://csidoc.insa-lyon.fr/these/doc/rapport%20_detaillee.pdfhttp://csidoc.insa-lyon.fr/these/doc/rapport_synthese.pdf
Rapport de Projet de Fin d’ÉtudesRemerciementsSommaire (hyperliens)ContextePrésentation générale de Doc'INSALes thèses de l'INSAObjectifs du projetMéthode suivieDéroulement du projet
Etat de l'artOutils de l'édition électroniqueCoexistence de formatsLangages de description de page
Serveurs de thèses existantLe NDLTDLes projets comparables au NDLTDUMIOpen Library Network OBN (Réseau PICA)Nature, nombre et format des documentsNature des documents proposésEtat et possibilités des services visitésA propos des formats
Choix techniquesPrésentation d'Adobe AcrobatLe format PDFPDFMakerPDFMarkL'opérateur pdfmarkRepères (OUT)Définition de liens
Acrobat DistillerAcrobat ExchangeAcrobat Reader
Format des documents électroniquesRègles d'éditionSchémas des liens hypertexteRepères entre les documents constituant la thèseNavigation dans chaque chapitre à l'aide des repèresAutres liens au sein d'un document
La chaîne d'édition numériqueFonctionnementAperçu de l'interfaceLe guide de conversion
Résultats obtenus - Le projet CITHERConclusionRéférences bibliographiquesAnnexesA - Manuel TechniqueB - Manuel de l'utilisateurC - Règles d'édition électroniqueD - Documents du projet