46
Stage d’ecdotique Sources Chrétiennes - UMR 5189 Hisoma Lyon, 6 mars 2014

2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma

Embed Size (px)

Citation preview

Stage d’ecdotique

Sources Chrétiennes - UMR 5189 Hisoma

Lyon, 6 mars 2014

Sommaire

● Spécificités de la publication en ligne

● Ce qu’il faut savoir d’XML

Spécificités de l’édition électronique

Qu’est-ce qu’un livre numérique ?

Définition de F. Kaplan :

“La description numérique standard du

contenu d’un livre”

Qu’est-ce qu’un livre ?

Pour Kaplan, un livre constitue une “représentation régulée” == représentation dont la production et l’usage sont soumis à un ensemble de règles

● annuaire,● facture, ● arbre généalogique, ● présentation powerpoint,● édition critique...

Double mécanisation

Les représentations régulées évoluent dans le sens d’une plus grande régularité == les conventions se transforment en mécanismes.exemple : les cartes

Processus en 2 étapes :1. règles de production2. règles d’usage

Standardisation du livre selon Kaplan

● un système dont la production et l’usage sont standardisés est une “machine”

● aujourd’hui, un livre numérique est la description numérique standard du contenu d’un livre

● à partir de ce standard on peut produire un livre papier ou lu sur écran

Standardisation du livre (suite)

● le livre cesse d’être un objet pour devenir une ressource

● la chaîne du livre va progressivement se réorganiser autour de ce nouveau modèle (guerre économique / guerre de standards - familles de formats en compétition : ePub et TEI prennent le pas sur pdf et PS (permettent mieux de décrire le contenu)

● les textes et les images peuvent être associés à des noeuds sémantiques bien définis => vont servir de pivots entre “livres” standardisés (cf. notions d’interopérabilité et de web de données)

Processus éditorial “classique”Etapes :• Évaluation et sélection des manuscrits• Préparation du contenu des ouvrages• Traitement et mise en forme du texte• Définition du support• Diffusion• Distribution• Conservation, valorisation du fonds

Contraintes :Garantir « citabilité », pérennité, stabilité, reconnaissance par les pairs et les évaluateurs

Fonctions éditorialesDans un cadre numérique, on a donc ces mêmes “grandes fonctions éditoriales” à transposer.

Selon D. Roux et P.-Y. Buard (Presses universitaires de Caen) :

“● éditer c’est traduire une structure logique en une forme intelligible

adaptée à un support donné…● éditer c’est produire des formes référençables…● éditer c’est diffuser…

Enjeux dans un contexte numérique ● La structuration à la source, par les auteurs (ce sont

eux qui ont la meilleure maîtrise des distinctions à opérer (balises)

● L’organisation d’une production la plus automatisée possible de la mise en page papier

● Le constat d’un élargissement de la notion d'ouvrage

Enjeux dans un contexte numérique ● La question cruciale et difficile des interopérabilitéS

● Innover, inventer de nouveaux objets éditoriaux : cf. l'avenir machinique du Livre (F. Kaplan)...

● ..tout en respectant les contraintes de stabilité, de citabilité, de pérennité correspondant aux exigences de l’édition scientifique...

Notions clés pour l’édition électronique

● principe de séparation : contenu vs présentation

● 1 fichier source → plusieurs mises en forme

● Le balisage = explicitation des distinctions que l’on considère comme pertinentes

Chaîne éditioriale numérique (Exemple des Presses universitaires de Caen - P.-Y Buard, D. Roux)

à quoi sert XML ?1. qu’est-ce que c’est ?

2. 4 principes

3. comment s’affiche-t-il ?

4. comment passe-t-on d’une source à des mises en formes modelées sur les spécificités des supports ?

Introduction à XML

1. XML = “extensible markup language”

● un langage de balisage qui enrichit l’information textuelle en délimitant des séquences à l’intérieur d’un flux (comme html)

● un langage extensible qui permet de créer ses propres balises et des langages avec leurs propres vocabulaire et grammaire

balisagebla bla <balise>mon contenu</balise> bla bla

bla bla <titre>Phèdre</titre> bla bla

bla bla <persName>Phèdre</persName> bla bla

affichage possiblebla bla “mon contenu” bla bla

bla bla Phèdre bla bla

bla bla PHEDRE bla bla

2. Principes● XML décrit les données mais ne les affiche pas

○ il ne fait rien, il décrit● Les balises ne sont pas prédéfinies

○ grande liberté pour décrire une structure spécifique = souplesse● Le balisage transmet la structure et le contenu

○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité

● Le jeu de balises peut être figé en une DTD ou schéma○ qui permet de vérifier automatiquement la conformité des balisages

produits = rigueur● XML permet un traitement automatisé en restant lisible par des

humains○ il sert à écrire des descriptions pivots dans une chaîne de production

2. Principes● XML décrit les données mais ne les affiche pas

○ il ne fait rien, il décrit● Les balises ne sont pas prédéfinies

○ grande liberté pour décrire une structure spécifique = souplesse● Le balisage transmet la structure et le contenu

○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité

● Le jeu de balises peut être figé en une DTD ou schéma○ qui permet de vérifier automatiquement la conformité des balisages

produits = rigueur● XML permet un traitement automatisé en restant lisible par des

humains○ il sert à écrire des descriptions pivots dans une chaîne de production

2. Principes● XML décrit les données mais ne les affiche pas

○ il ne fait rien, il décrit● Les balises ne sont pas prédéfinies

○ grande liberté pour décrire une structure spécifique = souplesse● Le balisage transmet la structure et le contenu

○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité

● Le jeu de balises peut être figé en une DTD ou schéma○ qui permet de vérifier automatiquement la conformité des balisages

produits = rigueur● XML permet un traitement automatisé en restant lisible par des

humains○ il sert à écrire des descriptions pivots dans une chaîne de production

2. Principes● XML décrit les données mais ne les affiche pas

○ il ne fait rien, il décrit● Les balises ne sont pas prédéfinies

○ grande liberté pour décrire une structure spécifique = souplesse● Le balisage transmet la structure et le contenu

○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité

● Le jeu de balises peut être figé en une DTD ou schéma○ qui permet de vérifier automatiquement la conformité des balisages

produits = rigueur● XML permet un traitement automatisé en restant lisible par des

humains○ il sert à écrire des descriptions pivots dans une chaîne de production

2. Principes● XML décrit les données mais ne les affiche pas

○ il ne fait rien, il décrit● Les balises ne sont pas prédéfinies

○ grande liberté pour décrire une structure spécifique = souplesse● Le balisage transmet la structure et le contenu

○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité

● Le jeu de balises peut être figé en une DTD ou schéma○ qui permet de vérifier automatiquement la conformité des balisages

produits = rigueur● XML permet un traitement automatisé en restant lisible par des

humains○ il sert à écrire des descriptions pivots dans une chaîne de production

structure d’un balise XML

<balise>chaîne de caractères</balise>

balise ouvrante balise fermanteContenu

structure d’un balise XML

<p> bla bla bla <titre>Phèdre</titre> bla bla </p>

explicitation de la fonction de la chaîne de caractères “Phèdre”

explicitation de la fonction de la chaîne de caractères “bla bla bla bla bla” dans la structure du texte

le début du fichier XML

Commence par une déclaration qui indique :

● la version de XML● le type d’encodage des caractères

<?xml version="1.0" encoding="UTF-8"?>

Structure

Un document XML est structuré comme un arbre.

<recette> <titre>Lait de poule</titre>

<ingredients> <ingredient><qté>1</qté><nom>oeuf</nom></ingredient> <ingredient><qté>10 cl</qté><nom>de lait chaud</nom></ingredient> <ingredient><nom>sucre en poudre</nom></ingredient> </ingredients>

<preparation> <explications>Verser le tout dans un verre à anse. Sucrer selon son goût. Remuer et ajouter un peu de noix de muscade râpée. </explications>

<durée/> </preparation></recette>

recette

titre

ingrédients

préparation

ingrédient

ingrédient

ingrédient

qté

nom

qté

nom

qté

nom

explications

durée

[ [lait de poule][ [ [1] [oeuf] ] [ [10 cl][de lait chaud] ] ] [ [Verser le tout dans un verre à anse. Sucrer selon son goût. Remuer et ajouter un peu de noix de muscade

râpée. ] ]

conformité / validité● document bien formé : conforme aux règles de

syntaxe générales (par ex. fermeture des balises, chevauchements interdits)

● document valide : suit des règles spécifiques définis dans une DTD ou un schéma (définit les autorisations d'imbrications et l'ordre d'apparition des éléments et de leurs attributs)

schéma ou DTD

● pas obligatoire mais compense la liberté laissée à chacun d’inventer ses balises

● avant tout : se mettre d’accord sur un langage commun… et expliciter des propriétés, des contraintes sur les relations entre éléments, etc.

vérifications automatiques

● des logiciels et des outils permettent de vérifier qu’un fichier est conforme à une DTD ou un schéma

● les logiciels d’édition XML permettent aussi d’afficher dans le contexte d’usage les propriétés possibles définies par le schéma

ex. dans Oxygen editor

Le schéma TEI ?● La TEI est un cadre d’encodage générique (les

recommandations ou “guidelines” pour la représentation des textes).

● Chaque projet fait un choix (une “personnalisation”)

● Cette personnalisation est explicitée dans un fichier XML de référence qui contient le schéma et sa documentation (notion de ODD)

affichage d’un fichier XML

La manière dont les éléments de l’arbre sont affichés est spécifié dans un autre fichier :

le fichier CSS (feuille de style de présentation)

propriétés cssrecette {

display:block;font-family:"Times new roman";margin:30px;

}titre {

display:block;font-weight:bold; font-size:2em; margin:30px;

}ingredients {

display:block;border:5px solid red;

}

Transformation d’un fichier XML

On a souvent besoin de réorganiser les éléments d’un fichier XML avant de les afficher, par ex. pour satisfaire les exigences différenciées de différents supports...

C’est le langage de transformation XSLT qui permet de faire cela.

Structure d’un fichier TEI

<TEI>

<teiHeader/>

<facsimile/>

<sourceDoc/>

<text/>

</TEI>

métadonnées

images (optionnel)

représentation “génétique”(optionnel) du document source

représentation du texte à travers sa structure logique