M2 gidn bn biblio_ml

  • Published on
    18-Jun-2015

  • View
    291

  • Download
    0

Embed Size (px)

Transcript

<ul><li> 1. Rpublique Tunisienne Universit de la manoubaMinistre de lenseignement suprieurInstitut suprieur de la DocumentationBiblioMLElabor par Tarek Hamdi[M2 GIDN : Bibliothques Numriques] 2012/2013</li></ul><p> 2. Table des matiresI. Introduction .......................................................................................................................................... 2II. UNIMARC ............................................................................................................................................. 2III. XML ..................................................................................................................................................... 3IV. BiblioML.............................................................................................................................................. 4V. Avantages de BiblioML ..................................................................................................................... 7VI. Utilisations et projets en BiblioML ..................................................................................................... 7VII. Conclusion ......................................................................................................................................... 8VIII. Exemple denregistrement BiblioML................................................................................................ 9IX. Webographie ................................................................................................................................... 15 3. I. Introduction BiblioML est une reprsentation en XML (DTD puis schma) des noticesbibliographiques base sur le format dchange UNIMARC qui respect la norme ISO 2709.La norme ISO 2709 est une norme internationale qui dfinit la structure des notices contenantdes donnes bibliographiques.Pour entamer le sujet de BiblioML, il parait indispensable dclaircir la notion dUNIMARCet de prsenter la technologie XML et les intersections possibles entre eux. II. UNIMARC UNIMARC est un standard dchange de donnes bibliographiques et est aussi dfinitcomme un format informatique international des donnes bibliographiques permettant leschanges entre logiciels documentaires ou bases de donnes bibliographiques. Principalementdfini par lIFLA (International Federation of Library and Institutions), lUNIMARC estconforme la norme ISO 2709. Le format UNIMARC est complt, en France, par larecommandation 995 qui complte lUNIMARC en prenant en compte le codage desinformations concernant les exemplaires (nombre et numros dexemplaires, par exemple).UNIMARC est un format "champs" (champ-valeur rptable), adaptable denombreux objets (bibliographie, autorits, classification, archivistique ...).Une notice UNIMARC est constitue de diffrents blocs numrots qui correspondent des types dinformations. Chacun de ces blocs est constitu de champs et de sous-champs.Les champs sont numrots, les sous-champs sont introduits par le symbole $ suivi dunelettre.Voici un exemple de fichier UNIMARC correspondant un exemplaire de code barre5777008954 de : Les Champignons / Jean C. Keller. - Paris : le Livre de poche, 1983 - 127 p. : ill. ; 17 cm. - (Le Livre de poche; 7847). Les rubriques dUNIMARC Significations*****cam**22002411**450* [Donnes codes]010 ** $a 2-253-03268-9 $b Br. $d 24 F [ISBN, reliure, prix]100 ** $a 19840104d1983****m**y0frey0103****ba [Donnes codes]101 ** $a fre[Code de langue]102 ** $a FR [Code de pays] 4. Les rubriques dUNIMARC Significations105 ** $a aay**zz**00|z|[Donnes codes]106 ** $a r [Donnes codes]200 1* $a Les Champignons $f Jean C. Keller [Titre, auteur]210 *0 $a Paris $c le Livre de poche $d 1983[Edition]215 ** $a 127 p. $c ill. $d 17 cm [Collation]225 2* $a Le Livre de poche $v 7847 [Collection]606 ** $3 $a Champignons[Vedette matire]676 ** $a 589.2 [Indice Dewey]700 1* $a Keller $b Jean[Vedette auteur]995 ** $f 5777008954 $k 589.2 KELRQ : les * dsignent des espaces = des blancs ou des positions non renseignesLes jeux de caractres ISO sont utiliss pour les changes de donnes en formatUNIMARC. Le label de notice, le rpertoire, les indicateurs, les codes de sous-zones et lesautres codes spcifis dans ce manuel doivent tre enregistrs en utilisant les caractres decommande et les caractres graphiques du jeu de caractres ISO 646 (IRV), ou alphabetinternational de rfrence, qui est considr par dfaut comme le jeu de caractres de lanotice. Les techniques dextension spcifies dans le jeu de caractres ISO/IEC 2022 sontutilises quand plusieurs jeux de caractres sont ncessaires dans une mme notice. III. XML XML (Extensible markup language) est un langage de balisage gnrique dont le butest de permettre la fonctionnalit et linteroprabilit du Web en permettant plusieurssystmes dinformation htrognes de communiquer et dchanger. Autrement dit il reposesur des principes : cest un langage de balisage extensible ; sa maintenance est assure par leW3C; les balises ne sont pas prdfinies mais libres et prcisent le sens ou la structure et nonpas la prsentation graphique; le contenu, la structure et la prsentation sont nettementdissocis ; la structure des informations est arborescente.Les raisons qui rendent intressantes son utilisation sont que : cest un format libre et ouvert;il est indpendant de toute plateforme informatique ; il est promis une certaine prennit (ilest rpandu dans plusieurs domaines et bnficie dune solide structure de maintenance) ; ilfacilite linteroprabilit.En bibliothque son utilisation permet : dafficher des notices bibliographiques sur le Web(BiblioML, MarcXML, MODS) ; dy changer ces notices (OAI, Dublin Core) ; dyditer des ressources (TEI, EAD) ; dy diffuser de linformation (RDF, RSS, Atom).Pour mieux cerner les possibilits permises par XML, faisons une petite comparaison avec leformat Marc. Marc se matrialise sous la forme dun format de saisie constitu de zonesprdfinies et immuables, certaines de ces zones permettent de communiquer avec dautressystmes utilisant le mme format ce qui permet plusieurs bibliothques dchanger desnotices bibliographiques par limport ou lexport de celles-ci. Mais ces changes neconcernent pas les usagers de quelques bibliothques qui sont dans limpossibilit daccder 5. aux notices via le Web (pour cela ils doivent pralablement passer par le site de laBibliothque pour accder son OPAC). Alors quavec XML, ces notices bibliographiquesdeviennent visibles partir du Web parce qutant reprables par les diffrents outils derecherche qui le sillonnent. En dautres termes les OPAC sont mis en surface et accessibles,en principe, tout internaute. Un autre avantage parmi dautres est, par exemple, lechangement de formats de notices de MARC XML qui se fait sans perte de donnes,permettant ainsi une retro-conversion fidle de ces dernires Ce souci de pallierlincapacit du Marc permettre les changes sur le WEB, sera lorigine de la cration duMarcXML par la Bibliothque du Congrs en juin 2002. IV. BiblioML BiblioML, ou Bibliographic Markup Language, est une DTD XML (XML Schmadepuis la version 0.6 ) cre en 1999 sous lgide de la Mission de la recherche et de latechnologie du Ministre de la Culture franais qui souhaitait mettre en place un outilcommun de gestion des rfrences bibliographiques de ses applications XML (dossiersdinventaire, dossiers dartistes, rapports de fouilles, etc.). Cette DTD a t dvelopp parMartin Svigny de la socit AJLSM pour reprsenter toutes les informations que lon trouvedans une notice UNIMARC (bibliographique et autorits) en format XML. Tableau de synthse des correspondancesUNIMARC : Bloc et champBiblioML : Elment-pre, lment-filsBloc des informations descriptives 2XX, champ 200 Bloc des informations descriptives 2XX, champ 205 Bloc des informations descriptives 2XX, champ 210 Bloc des informations descriptives 2XX, champ 215 Bloc des informations descriptives 2XX,champ 225Bloc des notes 3XXBloc des notes 3XXBloc 0XX, champ 012 , maisBloc des informations codes 1XXaussi etBloc des titres associs 5XXBloc de lindexation-matire 6XXBloc de la responsabilit intellectuelle 7XXBloc 8XX des donnesInternationales 6. BiblioML permet la conversion au format XML de notices bibliographiques oudautorit saisies en format UNIMARC. Dailleurs, le Manuel UNIMARC a servi de documentde rfrence lors de la cration de la DTD et les champs et sous-champs de BiblioMLcorrespondent ceux dUNIMARC. BiblioML comporte 224 lments (BiblioRecord tantcelui de plus haut niveau), 2 entits (BooleanAttribute et DataContent) mais aucune notation. Lelement BiblioRecord est compos de: Meta : mtadonnes lies lenregistrement (date et lieu de cration, etc...). Ces informations ont pour origine diffrents champs Unimarc, principalement les champs 0xx. Description : description de loeuvre : titre, auteurs, dates, diteur, droits... (champs 2xx et 5xx dUnimarc) Notes : notes concernant loeuvre, destines au public (champs 3xx) CodedValues : informations codes relatives la description de loeuvre (principalement, les champs 1xx dUnimarc) Subjects : sujets traits par loeuvre, et mots-cls correspondant (champs 6xx) Relationships : liens vers dautres oeuvres (champs 4xx) IntellectualResponsability : indications de responsabilit intellectuelle telles quelles figurent dans lISBD (champs 7xx) LocalData : donnes locales propres ltablissement crateur de la notice (champs 9xx) Tables : table des matires et Index Text : texte de prsentation de louvrage ... .....................Lexpressivit dXML peut tre mene plus loin. On peut ainsi tirer parti delimbrication des lments pour regrouper des informations et les nommer plus explicitement.Si le champ 200 est le titre, et quil y a un sous-champ pour les sous-titres ($e), il nest pasdsagrable de pouvoir lindiquer expressment, exemple en "pseudo-code" 7. La souplesse du format BiblioML permet dajouter bien dautres informations, commedes index, des tables des matires, des illustrations, et surtout, ce qui est trs particulier XML, du texte riche. La DTD BiblioML prvoit ainsi des noms permettant quune noticedevienne un document avec plus de contenu.BiblioML et La Compatibilits : Dans une conversion UNIMARC vers BiblioML, laplupart des champs documents trouve une place en XML. Pour des usages spcifiques uneorganisation, les outils livrs peuvent tre dits (XSL) pour rendre raison des besoins quinauraient pas t prvus. Par contre, une fois passs en BiblioML, surtout si les contenus ontt enrichis, un retour en MARC pourrait perdre une partie de linformation.Outils BiblioML. Autour de BiblioML, on trouvera des outils libres habituels : conversiondepuis lUNIMARC, transformation de restitution. On mentionne particulirement BiB-X, uneapplication libre qui administre, cherche et produit des notices. On notera la possibilit depouvoir dfinir ses propres formulaires de saisie (selon le type de documents), dans unstandard XML (XForm).BiblioML apporte des extensions au format UNIMARC, dont voici les plussignificatives :- Il est possible dencoder le texte du document en question, inclus dans llment .- Il est galement envisageable dintgrer des tables et des index, au moyen de la balise, puis ou . Il sagit dune nette progression par rapport la possibilit de rfrencer une table des matires au moyen du champ 359 puisquil ny aplus de limitation de niveaux darborescence.- En ce qui concerne les liens entre notices, indiqus par les lments puis, plusieurs solutions sont possibles. Comme le propose MARC, un simple lienentre les notices peut tre cr. Llment est alors vide et lattribut RecordIDindique le numro de la notice concerne. On peut galement envisager dinclure la secondenotice dans la premire, en utilisant llment .Dans tous les cas, lattribut Relation permet dindiquer le type de relation entre les deuxouvrages dcrits. BiblioML apporte ainsi davantage de souplesse et de lisibilit quelutilisation ventuelle des champs 4XX proposs par UNIMARC.- Linformation concernant les exemplaires locaux peut tre donne directement, alors quunenotice dexemplaire devait tre lie la notice bibliographique dans UNIMARC. Pour cela ilsuffit dutiliser llment et ses lments-fils. Cette exprience de traitement avecBiblioML montre que si toute information de type bibliographique aurait pu tre saisie enMARC, BiblioML apporte davantage de clart. Les extensions proposes par BiblioML nesont donc pas si significatives pour la description bibliographique du livre en tant que telle. Levritable enrichissement, cest de rendre possible lintgration de tout ou partie du documentprimaire. 8. Dautre part, BiblioML permet une description bibliographique fine et complte, maisles possibilits de renseigner les mtadonnes de gestion techniques et administratives sontbien moins riches que celles que proposent le Dublin Core ou len-tte de la TEI. En effet,lencodage dans BiblioML de ces mtadonnes se limite llment , et ellescorrespondent ni plus ni moins celles qui figurent dans une notice MARC. Cela doit treperu comme une limitation, car dans un contexte de numrisation et ddition sur leWeb, le contexte du document ainsi que les conditions daccs doivent tre prcises. V. Avantages de BiblioMLBrivement, lutilisation du format BiblioML nous engendre plusieurs avantages dont lesplus importants sont les suivants : Format moderne : base sur XML, adapte Internet Format ouvert : mises dans le domaine public, les spcifications de BiblioML sont disponibles sur le site officiel du ministre de la culture. Modle de caractres Unicode : toutes les critures, bases sur ce systme de codage universel, sont reprsentables sans ambigut. Hirarchie complte : tous les documents sont dcrits exactement, quelle que soit la complexit de leur structure Taille illimite : la taille des documents ou des zones nest pas limite. Toutes les extensions sont possibles : texte intgral, table des matires, index, illustrations graphiques ou sonores... Facilits de comprhension : les balises BiblioML permettent de dcrire lisiblement la structure et la smantique de chaque lment VI. Utilisations et projets en BiblioMLUtilisant ou Sappuyant sur BiblioML, plusieurs projets ont vu le jour. Voici quelquesapplications utilisant BiblioML : La bibliographie nationale franaise (en ligne depuis juillet 2001). Les notices bibliographiques sont dabord catalogues en Intermarc puis extraites en UNIMARC, et ensuite converties en XML selon la DTD BiblioML. Un serveur de transformation produit enfin des pages HTML pour publication sur le Web. 9. La bibliographie nationale franaise : le Dpt lgal utilise BiblioML pour gnrer les pages HTML statiques des diffrents numros de la Bibliographie (http://bibliographienationale.bnf.fr). Base de documents SANGIS (Rseau du sud-est asiatique pour un systme dinformations gologiques SANGIS) du CIFEG (centre international pour la formation et les changes en gosciences) : base de donnes BiblioML pour la diffusion dun catalogue collectif de rfrences bibliographiques dans le domaine des sciences de la terre. Bilans scientifiques rgionaux :...</p>