M2 gidn bn biblio_ml

Embed Size (px)

Text of M2 gidn bn biblio_ml

  • 1. Rpublique Tunisienne Universit de la manoubaMinistre de lenseignement suprieurInstitut suprieur de la DocumentationBiblioMLElabor par Tarek Hamdi[M2 GIDN : Bibliothques Numriques] 2012/2013

2. Table des matiresI. Introduction .......................................................................................................................................... 2II. UNIMARC ............................................................................................................................................. 2III. XML ..................................................................................................................................................... 3IV. BiblioML.............................................................................................................................................. 4V. Avantages de BiblioML ..................................................................................................................... 7VI. Utilisations et projets en BiblioML ..................................................................................................... 7VII. Conclusion ......................................................................................................................................... 8VIII. Exemple denregistrement BiblioML................................................................................................ 9IX. Webographie ................................................................................................................................... 15 3. I. Introduction BiblioML est une reprsentation en XML (DTD puis schma) des noticesbibliographiques base sur le format dchange UNIMARC qui respect la norme ISO 2709.La norme ISO 2709 est une norme internationale qui dfinit la structure des notices contenantdes donnes bibliographiques.Pour entamer le sujet de BiblioML, il parait indispensable dclaircir la notion dUNIMARCet de prsenter la technologie XML et les intersections possibles entre eux. II. UNIMARC UNIMARC est un standard dchange de donnes bibliographiques et est aussi dfinitcomme un format informatique international des donnes bibliographiques permettant leschanges entre logiciels documentaires ou bases de donnes bibliographiques. Principalementdfini par lIFLA (International Federation of Library and Institutions), lUNIMARC estconforme la norme ISO 2709. Le format UNIMARC est complt, en France, par larecommandation 995 qui complte lUNIMARC en prenant en compte le codage desinformations concernant les exemplaires (nombre et numros dexemplaires, par exemple).UNIMARC est un format "champs" (champ-valeur rptable), adaptable denombreux objets (bibliographie, autorits, classification, archivistique ...).Une notice UNIMARC est constitue de diffrents blocs numrots qui correspondent des types dinformations. Chacun de ces blocs est constitu de champs et de sous-champs.Les champs sont numrots, les sous-champs sont introduits par le symbole $ suivi dunelettre.Voici un exemple de fichier UNIMARC correspondant un exemplaire de code barre5777008954 de : Les Champignons / Jean C. Keller. - Paris : le Livre de poche, 1983 - 127 p. : ill. ; 17 cm. - (Le Livre de poche; 7847). Les rubriques dUNIMARC Significations*****cam**22002411**450* [Donnes codes]010 ** $a 2-253-03268-9 $b Br. $d 24 F [ISBN, reliure, prix]100 ** $a 19840104d1983****m**y0frey0103****ba [Donnes codes]101 ** $a fre[Code de langue]102 ** $a FR [Code de pays] 4. Les rubriques dUNIMARC Significations105 ** $a aay**zz**00|z|[Donnes codes]106 ** $a r [Donnes codes]200 1* $a Les Champignons $f Jean C. Keller [Titre, auteur]210 *0 $a Paris $c le Livre de poche $d 1983[Edition]215 ** $a 127 p. $c ill. $d 17 cm [Collation]225 2* $a Le Livre de poche $v 7847 [Collection]606 ** $3 $a Champignons[Vedette matire]676 ** $a 589.2 [Indice Dewey]700 1* $a Keller $b Jean[Vedette auteur]995 ** $f 5777008954 $k 589.2 KELRQ : les * dsignent des espaces = des blancs ou des positions non renseignesLes jeux de caractres ISO sont utiliss pour les changes de donnes en formatUNIMARC. Le label de notice, le rpertoire, les indicateurs, les codes de sous-zones et lesautres codes spcifis dans ce manuel doivent tre enregistrs en utilisant les caractres decommande et les caractres graphiques du jeu de caractres ISO 646 (IRV), ou alphabetinternational de rfrence, qui est considr par dfaut comme le jeu de caractres de lanotice. Les techniques dextension spcifies dans le jeu de caractres ISO/IEC 2022 sontutilises quand plusieurs jeux de caractres sont ncessaires dans une mme notice. III. XML XML (Extensible markup language) est un langage de balisage gnrique dont le butest de permettre la fonctionnalit et linteroprabilit du Web en permettant plusieurssystmes dinformation htrognes de communiquer et dchanger. Autrement dit il reposesur des principes : cest un langage de balisage extensible ; sa maintenance est assure par leW3C; les balises ne sont pas prdfinies mais libres et prcisent le sens ou la structure et nonpas la prsentation graphique; le contenu, la structure et la prsentation sont nettementdissocis ; la structure des informations est arborescente.Les raisons qui rendent intressantes son utilisation sont que : cest un format libre et ouvert;il est indpendant de toute plateforme informatique ; il est promis une certaine prennit (ilest rpandu dans plusieurs domaines et bnficie dune solide structure de maintenance) ; ilfacilite linteroprabilit.En bibliothque son utilisation permet : dafficher des notices bibliographiques sur le Web(BiblioML, MarcXML, MODS) ; dy changer ces notices (OAI, Dublin Core) ; dyditer des ressources (TEI, EAD) ; dy diffuser de linformation (RDF, RSS, Atom).Pour mieux cerner les possibilits permises par XML, faisons une petite comparaison avec leformat Marc. Marc se matrialise sous la forme dun format de saisie constitu de zonesprdfinies et immuables, certaines de ces zones permettent de communiquer avec dautressystmes utilisant le mme format ce qui permet plusieurs bibliothques dchanger desnotices bibliographiques par limport ou lexport de celles-ci. Mais ces changes neconcernent pas les usagers de quelques bibliothques qui sont dans limpossibilit daccder 5. aux notices via le Web (pour cela ils doivent pralablement passer par le site de laBibliothque pour accder son OPAC). Alors quavec XML, ces notices bibliographiquesdeviennent visibles partir du Web parce qutant reprables par les diffrents outils derecherche qui le sillonnent. En dautres termes les OPAC sont mis en surface et accessibles,en principe, tout internaute. Un autre avantage parmi dautres est, par exemple, lechangement de formats de notices de MARC XML qui se fait sans perte de donnes,permettant ainsi une retro-conversion fidle de ces dernires Ce souci de pallierlincapacit du Marc permettre les changes sur le WEB, sera lorigine de la cration duMarcXML par la Bibliothque du Congrs en juin 2002. IV. BiblioML BiblioML, ou Bibliographic Markup Language, est une DTD XML (XML Schmadepuis la version 0.6 ) cre en 1999 sous lgide de la Mission de la recherche et de latechnologie du Ministre de la Culture franais qui souhaitait mettre en place un outilcommun de gestion des rfrences bibliographiques de ses applications XML (dossiersdinventaire, dossiers dartistes, rapports de fouilles, etc.). Cette DTD a t dvelopp parMartin Svigny de la socit AJLSM pour reprsenter toutes les informations que lon trouvedans une notice UNIMARC (bibliographique et autorits) en format XML. Tableau de synthse des correspondancesUNIMARC : Bloc et champBiblioML : Elment-pre, lment-filsBloc des informations descriptives 2XX, champ 200 Bloc des informations descriptives 2XX, champ 205 Bloc des informations descriptives 2XX, champ 210 Bloc des informations descriptives 2XX, champ 215 Bloc des informations descriptives 2XX,champ 225Bloc des notes 3XXBloc des notes 3XXBloc 0XX, champ 012 , maisBloc des informations codes 1XXaussi etBloc des titres associs 5XXBloc de lindexation-matire 6XXBloc de la responsabilit intellectuelle 7XXBloc 8XX des donnesInternationales 6. BiblioML permet la conversion au format XML de notices bibliographiques oudautorit saisies en format UNIMARC. Dailleurs, le Manuel UNIMARC a servi de documentde rfrence lors de la cration de la DTD et les champs et sous-champs de BiblioMLcorrespondent ceux dUNIMARC. BiblioML comporte 224 lments (BiblioRecord tantcelui de plus haut niveau), 2 entits (BooleanAttribute et DataContent) mais aucune notation. Lelement BiblioRecord est compos de: Meta : mtadonnes lies lenregistrement (date et lieu de cration, etc...). Ces informations ont pour origine diffrents champs Unimarc, principalement les champs 0xx. Description : description de loeuvre : titre, auteurs, dates, diteur, droits... (champs 2xx et 5xx dUnimarc) Notes : notes concernant loeuvre, destines au public (champs 3xx) CodedValues : informations codes relatives la description de loeuvre (principalement, les champs 1xx dUnimarc) Subjects : sujets traits par loeuvre, et mots-cls correspondant (champs 6xx) Relationships : liens vers dautres oeuvres (champs 4xx) IntellectualResponsability : indications de responsabilit intellectuelle telles quelles figurent dans lISBD (champs 7xx) LocalData : donnes locales propres ltablissement crateur de la notice (champs 9xx) Tables : table des matires et Index Text : texte de prsentation de louvrage ... .....................Lexpressivit dXML peut tre mene plus loin. On peut ainsi tirer parti delimbrication des lments pour regrouper des informations et les nommer plus explicitement.Si le champ 200 est le titre, et quil y a un sous-champ pour les sous-titres ($e), il nest pasdsagrable de pouvoir lindiquer expressment, exemple en "pseudo-code" 7. La souplesse du format BiblioML permet dajouter bien dautres informations, commedes index, des tables des matires, des illustrations, et surtout, ce qui est trs particulier XML, du text