Num BDAN 2011 Cours Complet 20111128

Embed Size (px)

Citation preview

Techniques de NumrisationCours licence BDAN IUT2 Grenoble 2011-2012

Jean-Michel Mermet Charg de Mission Documentation DSI de Grenoble Universits Tl : 04 76 51 49 18 Ml : [email protected]

Ce cours est diffus via une licence Creative Commons by-nc-sa (modalits http://creativecommons.org/licenses/by-ncsa/2.0/fr/)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 1/84

A.1.

IntroductionPrsentation et primtre du cours

La numrisation est la conversion d'un signal analogique en un signal numrique en fonction de deux paramtres : l'chantillonnage et la quantification. C'est conceptuellement une modlisation mathmatique de certains aspects de la ralit. La numrisation concerne aussi bien les images, les textes, que le son et les vidos. Le cours a pour but de vous faire parcourir et rflchir sur toutes les tapes d'un projet de numrisation, depuis l'ide initiale et l'intrt d'y recourir jusqu' la production des donnes numriques. La numrisation, en effet, ne s'arrte pas, loin de l, l'tape technique qui consiste faire passer par exemple une photo argentique sous forme de fichier image : Il y a, en amont toute la rflexion de ce que l'on veut numriser, pourquoi on veut le faire, comment on va le faire, dans quels formats, pour quels publics, etc... Il y a, en aval, toute la rflexion sur le mode de mise disposition des fichiers numriques, leur identification, leur authentification, leur formats de diffusion, leur prservation pour le futur.

Il y a donc bien une vritable chane numrique concevoir, mettre en place, faire fonctionner. Nous verrons que tout projet de numrisation implique une rflexion pralable srieuse sur le long terme.

a.

Primtre du coursles aspects juridiques ; la gestion des assets numriques par les systmes de gestion de contenu (CMS) ; la thorie des mtadonnes ; les traitements graphiques, sonores et vidos appliquer aux fichiers obtenus ; nous n'aborderons que ce qui est ncessaire pour reprsenter correctement les documents analogiques sous forme numrique ; les aspects d'archivage des donnes numriques ; la publication des collections sur internet, objet de la suite de ce cours au second semestre.

Ce cours ne couvrira que trs rapidement les notions suivantes :

2.a.

L'importance de la numrisationPrambule

Selon une enqute rcente du Rseau canadien dinformation sur le patrimoine propos de lutilisation de la technologie dans les muses, 94 % des institutions souhaitent faire de la numrisation leur premire priorit en matire de technologie pour lanne 2006. La numrisation [] est dsormais une activit importante pour les muses. tant donn que les connections Internet haute vitesse deviennent de plus en plus abordables et accessibles, il est normal que les muses publient de plus en plus sur leur site des images de leurs artefacts. 1 Voir aussi la liste, forcment partielle, tablie sur Wikipdia2. La numrisation a aussi d'importantes applications dans le domaine mdical, comme en tmoigne le projet PACS (Picture Archiving and Communication System) de la Socit Franaise de Radiologie, qui vise mettre en rseau les archives d'images mdicales. La mise en place devrait tre ralise en plusieurs tapes. Actuellement, les hpitaux commencent numriser leurs images mdicales ainsi que leurs archives. Dans une prochaine tape, leurs donnes seront mises en rseau pour tre changes entre les services et plus grande chelle entre les tablissements mdicaux3 Les documents numriques issus d'une numrisation servent : 1 2 3

limpression, la documentation,http://www.chin.gc.ca/Francais/Contenu_Numerique/lere_de_la_numerisation.html (visit le 27/08/2009) http://en.wikipedia.org/wiki/List_of_digital_library_projects (visitle19/8/2010) http://www.enssib.fr/breves/2010/05/18/imagerie-medicale-numerisation-massive (visitle18/8/2010)[info du 18/5/2010]

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 2/84

la recherche, la publication en ligne, la gestion des collections, la prparation de catalogues la promotion dexpositions ../...

Pourquoi la numrisation est-elle devenue si populaire ?4 Elle permet de rendre les collections beaucoup plus accessibles (collections autrefois trop lointaines, objets trop fragiles pour tre manipuls ou exposs) Elle permet de mettre en valeur des aspects particuliers de lhistoire locale ou datteindre un public national ou international. Elle permet de rassembler, des fins de comparaison et de recherche, des objets ou des collections disperss en plusieurs lieux Elle peut devenir un puissant outil denseignement. La numrisation peut galement contribuer la gestion des collections en procurant tout le personnel une meilleure information sur le contenu des collections. Le simple fait de slectionner des objets numriser fournit au personnel une occasion supplmentaire dvaluer et de consigner ltat des objets. La numrisation incite en outre amliorer la documentation, en particulier lorsque des enregistrements daccompagnement sont destins tre rendus public en mme temps que les images numrises : le besoin de normes et dune meilleure information devient rapidement vident. Les objets numrises sont utilises dans une vaste gamme de produits de diffusion comme les sites Internet, le matriel de promotion, de nouveaux articles pour la boutique souvenir dun muse (tee-shirts, mugs, ...). La numrisation contribue aux stratgies de conservation puisque, une fois numriss, les originaux analogiques fragiles sont davantage labri des manipulations et des agressions. Comme la technologie numrique permet de faire une recherche dans un grand nombre denregistrements, de modifier et de traiter des images et des textes et de rassembler des lments disparates selon des modalits nouvelles, elle peut se rvler un outil souple et prcieux dans tous les secteurs dun muse. La facilit dexcution des tches mentionnes ci-dessus favorise galement une collaboration plus troite avec dautres tablissements.

b.

Pourquoi numriser ?Plus de dtrioration des supports analogiques en consultation Une fois numriss, les documents originaux peuvent tre conservs dans des conditions optimales, sans le danger que reprsente leur manipulation. On augmente donc leur scurit. Reproduction - il est possible de raliser facilement et rapidement des copies de l'information dj numrise, sans perte de qualit. Automatisation - sont automatiss non seulement la restitution des lments demands, grce l'utilisation de systmes de stockage robotiss, mais aussi le processus de reproduction. Recherche - la numrisation offre la possibilit d'effectuer des recherches dans les catalogues aussi bien locaux que lointains et de crer un tissu de liens ou de pointeurs renvoyant du document consult par l'utilisateur des documents connexes de la mme collection ou d'autres. Des recherches de texte intgral peuvent en outre tre effectues. Des techniques de recherche analogues sont actuellement labores pour les documents sonores et les images (recherche et reconnaissance de phrases musicales, de rythmes, de motifs, de formes, ...) Accessibilit distance elle tient la capacit d'envoyer un signal numrique sur les rseaux de tlcommunications sans perte de qualit. Selon Francis Pisani5 : L'intrt primordial de lahttp://www.chin.gc.ca/Francais/Contenu_Numerique/ Guide_Gestionnaires/introduction.html (visit le 24/7/2006) http://pisani.blog.lemonde.fr/pisani/2006/06/plein_de_bonnes.html, (visit le 18/08/2007)

4 5

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 3/84

numrisation des livres est la mise du savoir la disposition de populations qui sans cela n'y auraient pas accs, notamment dans le sud . Accessibilit temporelle -- la collection numrise est accessible 24 heures sur 24 avec un minimum de personnel. Accessibilit aux personnes prsentant un handicap - l'accessibilit est grandement amliore pour des publics dficients visuels ou moteurs. Qualit - elle tient la possibilit de numriser un document avec une trs forte rsolution, selon les besoins. Il est galement trs facile de raliser des copies de qualit infrieure partir de la copie de haute qualit, chaque fois que ncessaire. Espace ncessaire - la haute densit du stockage de l'information sur les supports numriques peut se traduire par une rduction majeure de l'espace de stockage ncessaire. D'o, galement, une rduction de l'espace ncessitant une rgulation climatique conforme aux normes archivistiques et, en consquence, un abaissement des frais de fonctionnement de l'institution. Par ailleurs, un signal numrique peut tre fortement compress avec ou sans perte d'information (dans le cas de la perte d'information, elle peut tre indtectable). Une information numrique est facilement stockable sur des supports dont la capacit augmente et dont le cot et la taille diminuent rapidement au fil des annes. Futurs transferts de la collection - si une collection est copie sur un support analogique, le cot de ses futurs transferts sera identique celui de cette premire reproduction. Si elle est copie sur un support numrique, on pourra, lors des futurs transferts, tirer parti des possibilits de recopie automatise inhrentes au numrique. Le transfert de collections de donnes numriques n'est pas un phnomne nouveau. Les milieux bancaires, par exemple, ont transfr plusieurs fois avec succs leurs banques de donnes. Leur exprience peut offrir des enseignements utiles pour le transfert de l'information textuelle, visuelle et sonore. Incitation entreprendre des recherches les chercheurs seront d'autant plus enclins exploiter un fonds qu'il sera numris, avec tous les avantages que cela lui procure. La numrisation facilite et rend plus efficace la recherche par les conservateurs, les tudiants, les enseignants, les rudits, les chargs de cours l'universit, les chercheurs et les spcialistes, car elle permet d'tudier des documents disparates dans des contextes nouveaux. Il y a davantage d'exploration de ressources lies aux objets exposs, et l'information propos du muse et de ses collections importantes s'en trouve amliore. Les images numrises peuvent tre utiles aux professionnels et chercheurs de muses du monde entier qui explorent les liens, les ressemblances et les diffrences avec les travaux d'autres tablissements. Constitution d'une copie de sauvegarde/ de remplacement Le document numrique peut tre considr comme une copie de sauvegarde de l'original. La numrisation offre une stratgie de remplacement pour des objets, par exemple des films et des archives sonores, en voie de dtrioration. Amlioration de la lisibilit des documents : le traitement numrique peut amliorer la lisibilit des documents. La transmission numrique est plus rsistante que l'analogique aux dfauts de transmission puisqu'il suffit de reconnatre, la rception du message, sa prsence et non sa forme pour le reconstituer ; la puissance ncessaire pour la transmission est donc plus faible et les quipements de rception souvent plus petits. On peut galement vrifier la bonne transmission par des techniques de chiffrages telles que les checksums : un calcul trs sensible aux erreurs est effectu avant et aprs la transmission. Les rsultats sont compars suite un transfert. Si l'information numrique a t modifie, mme trs peu, les rsultats du checksum sont trs diffrents. On retransmet alors automatiquement les donnes numriques. Par ailleurs, le numrique permet de transmettre tous les signaux de la mme manire, quelle que soit la nature de l'information (voix, donnes, images...) ; les quipements de transmission sont donc les mmes pour le tlphone ou la tlvision par exemple. Le volume ou le dbit d'un signal transmis numriquement peut galement tre fortement rduit par compression, sans perte (loseless) ou sans perte sensible de la qualit, en supprimant toutes les informations inutiles (redondantes ou imperceptibles par les sens humains). Dans une transmission vido par exemple, au lieu de traiter numriquement 24 images par seconde, on ne traite que la diffrence entre deux images conscutives. Cette diffrence tant la plupart du temps trs faible, plus de 98% de l'information peut tre laisse de ct sans perte de qualit des images.

Conclusion technique : La numrisation apporte ainsi de nombreux avantages, facilitant le traitement et le stockage des informations et offrant une qualit de transmission incomparable. Ces qualits doubles de son

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 4/84

indpendance par rapport la nature de l'information transmise expliquent la gnralisation de l'emploi des technologies numriques aux dpens des technologies analogiques. Un billet du blog Figoblog6 dtaille un ensemble de raisons pour lesquelles on peut vouloir numriser en bibliothque. L'auteur distingue plusieurs raisons : la valorisation d'un fonds : Avantage : c'est joli, ludique, attrayant, a donne une bonne image de la bibliothque et a plat aussi aux gens qui ne sont pas spcialistes. Inconvnient : ce genre d'interface est inutilisable par des personnes qui s'intressent au mme document d'autres fins. la numrisation " la demande" ou spcialise : Avantage : le public est dj cibl et on rpond prcisment ses attentes donc le succs est plus facilement assur, au moins auprs d'un nombre limit de personnes. Inconvnient : c'est toujours inutilisable par des personnes qui s'intressent au mme document d'autres fins (typiquement, c'est bien de ne numriser que des enluminures mais celui qui travaille sur le texte du manuscrit se retrouve le bec dans l'eau). Ou alors cela ne couvre qu'un spectre documentaire/thmatique trs limit. la numrisation de sauvegarde : Avantage : une grande facilit de consultation par rapport l'ancien support de substitution, qui n'offrait que des capacits limites de lecture simultane et une "exprience de lecture" peu optimise. Inconvnient : pas de public assur pour consulter cette numrisation, et comme les originaux sont en voie de disparition, il faut qu'elle soit fiable, authentique et prenne car c'est bientt (ou dj) le seul moyen d'accder ces documents l. la bibliothque numrique : Avantage : c'est un service cohrent avec une politique documentaire, des missions, des services, etc. capable en principe de rpondre aux besoins d'un public diversifi. Inconvnient : c'est trs compliqu et coteux organiser. Mme trs trs compliqu.

c.I.

Inconvnients, limites et risques de la numrisationLE COT

C'est un des reproches souvent fait aux projets de numrisation. Les points soulevs ci-aprs 7 sont parfois judicieux, parfois exagrs. Ils mritent en tout cas qu'on sache y rpondre le cas chant. Investissement initial - le matriel ncessaire pour effectuer la numrisation peut tre coteux et demande souvent tre utilis par des oprateurs qualifis pour donner les meilleurs rsultats. Contraintes de rangement - les supports utiliss pour stocker l'information numrise devront tre conservs dans un environnement trs propre et trs stable en temprature et en hygromtrie, ce qui accrotra la consommation d'nergie imputable la collection. L'amnagement de cet espace de rangement l'atmosphre stabilise exige en outre un investissement initial. Frais de fonctionnement - on craint qu'une collection numrise ne doive elle aussi tre frquemment recopie, avec les cots de main-d'uvre, d'nergie et d'achat de nouveaux supports que cela implique et que la survie de l'information numrique ne soit pas garantie au-del de deux trois ans si elle est stocke sur bande magntique et de trois cinq ans si elle est conserve sur disque optique. Cots de prparation - un document doit tre prpar (parfois de faon destructrice, comme le massicotage des ouvrages avant leur passage par le scanner) pour la saisie numrique. Outre l'ventuelle prparation physique requise, le contenu initial doit en tre class et index et les rfrences textuelles introduites dans la base de donnes par du personnel spcialis, oprations qui peuvent tre coteuses. On pense que la copie de l'information des supports existants sur de nouveaux supports implique d'importantes contraintes de main-d'uvre.

II.

LE RISQUE IMPORTANT DE MAUVAIS CHOIX TECHNOLOGIQUESLors de la numrisation. Des erreurs notamment lors du choix de l'chantillonnage ou du format de fichier (formats propritaires) peuvent empcher une exploitation future des donnes. Lors de la gestion des documents numriques. Des erreurs lors du stockage (supports, conditions de stockage) et lors de la prservation des documents peuvent conduire des pertes svres de donnes (cas des donnes sur les vols lunaires de la NASA). Ne jamais oublier que les dbuts de l're informatique ont t marqus par la plus grande perte de donnes de l'histoire de l'humanit.http://www.figoblog.org/document1637.php (visit le 19/07/2007) Tir de http://www.unesco.org/webworld/mdm/administ/fr/MOW_finD.html#3 (visit le 19/07/2007)

6 7

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 5/84

III.

LA PERTE DE REPRES PHYSIQUES

Une partie de l'information d'un document est contenue dans le support physique. La numrisation ne retient donc pas tout : l'odeur, le poids, la texture ne sont pas reproduits.

IV.

UNE MOINS GRANDE FACILIT D'ASSIMILATION DES CONTENUS

Une moins grande facilit d'assimilation des contenus par rapport aux mdia analogiques du fait de la non-linarit de la lecture dans les documents multimdia. Ce point est discut, mais il faut peut-tre le considrer dans la problmatique plus gnrale des limites actuelles des interfaces d'accs l'information.

d.I.

Quelques grands programmes de numrisationGOOGLE BOOKS

L'extraordinaire projet de Google8, qui a fait couler beaucoup d'encre ... lectronique ! Pour revenir l'historique de ce dossier mouvement, on peut lire avec intrt le dossier l'Atelier de Jean de Chambure9 (article datant de 2005). Depuis ce dossier, la partie semble bien mal engage par Europanea... Dpart de Jeaneney, et les Vaudois qui, les premiers europens, rompent le front du refus et signent avec Google. Cf l'article Les Vaudois vendent leur patrimoine crit Google 10 : Quelque 100000 ouvrages, tous libres de droits, du XVIIe au XIXe sicle, seront digitaliss Lausanne selon un calendrier dfini dans un mois. Cette numrisation sera presque entirement finance par Google, ce qui reprsente environ 12,5 millions de francs. La BCU ne payera que le traitement des fichiers pour la consultation et l'engagement d'une personne qui suivra l'aventure jusqu'au bout. Mais la diffrence avec les projets publics de bibliothque sur Internet, c'est que les fichiers de livres numriss deviennent possession de Google. La dcision de la BCU est indite : jusqu'ici, toutes les bibliothques francophones, qu'elles soient de France, de Belgique, de Suisse ou du Canada s'taient ranges derrire les projets publics concurrents l'offensive Google, c'est--dire la Bibliothque numrique francophone et Europeana, le noyau embryonnaire de bibliothque numrique europenne lance en mars dernier par la France, la Hongrie et le Portugal. En concluant un partenariat avec Google, la BCU ouvre une brche et manifeste tout haut l'impatience que d'autres ressentent face la lenteur des projets de numrisations publics: Le partenariat avec Google s'annonce autrement plus srieux que le projet europen , dclare Hubert Villard, directeur de la Bibliothque cantonale et universitaire vaudoise. Voir aussi, en juillet 2008, la dcision de la ville de Lyon de faire appel Google pour des projets de numrisation11 Lobjectif de la BM de Lyon est de numriser 500 000 ouvrages sur les 1 350 000 de son fond ancien, dans un dlai de 10 ans. Il sagit de documents antrieurs au XX sicle et libres de droits. Google devra les numriser la fois en mode image et en mode texte, dans leur intgralit. Linternaute pourra alors avoir accs aux informations par le mode classique de recherche par page de Google mais pourra galement tlcharger les uvres intgralement. En change, Google devient propritaire de ces fichiers numriques et dispose dune exclusivit commerciale pour leur exploitation durant 25 ans. Voir enfin les rumeurs (fondes infondes) de collaboration entre la BNF et Google. Qui l'eut cr !

II.

GALLICA

Serveur de consultation distance des collections numrises de la Bibliothque Nationale de France 12. Les fonds numriss constituent une bibliothque patrimoniale et encyclopdique, avec des ouvrages numriss8 9 10 11 12 http://books.google.com/ (visitle19/07/2007) http://www.atelier.fr/type/bataille,livre,internet-30041-Dossier.html (visitle19/07/2007) Le temps.ch du 16 mai 2007 http://libelyon.blogs.liberation.fr/info/2008/07/la-bibliothque.html (visitle25/07/2007) http://gallica.bnf.fr/ (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 6/84

en mode image, et en mode texte, des images fixes, des documents sonores (fonds du domaine public). Ces documents sont imprimables et tlchargeables par le lecteur, dans le cadre d'un usage strictement priv. Gallica offre (au 20/8/2010)13 : Vous trouverez sur Gallica 1 191 998 documents 184 642 Livres, 10 241 Cartes, 5 494 Manuscrits, 160 890 Images, 773 287 Presse et Revues, 3 092 Partitions, 1 071 Paroles et musiques, 27 570 de E-distributeurs, 25 711 d'autres bibliothques

Le taux mensuel de consultation des documents a pass la barre du million en mars 2006.

III.

PROJET NUMDAM DE LA CELLULE MATHDOC GRENOBLE

Numrisation de Documents Anciens Mathmatiques14 : dans le but de soutenir les revues de mathmatiques, le programme NUMDAM met en place un libre accs aux donnes bibliographiques et au texte des articles qui y sont parus. Pour chaque revue concerne, la totalit des volumes publis jusqu'en l'an 2000 a t convertie au format numrique, ce qui reprsente actuellement plus de 560 000 pages numrises et 27 000 articles mis en ligne. Les articles eux-mmes sont disponibles pour consultation en ligne l'issue d'un dlai (crneau mobile) pendant lequel ils sont rservs aux seuls abonns. Il est possible de rechercher directement un article par nom d'auteur, mots du titre ou mots cls prsents dans le texte. Il est galement possible de feuilleter les sommaires de l'ensemble des volumes. Voir les collections sur la page ddie du site15.

IV.

INTERNET ARCHIVE

Internet Archive16 est une organisation but non commercial fonde dans le but d'tre la bibliothque d'internet . Son but est de s'adresser aux chercheurs, aux historiens, aux tudiants, aux personnes prsentant un handicap et au grand public pour leur offrir des collections historiques qui existent en format numrique. Fonde en 1996, puis refinance en 1999, cette organisation connu une grande croissance et inclut maintenant des collections consquentes. Elle propose des textes, de l'audio, des films, des logiciels ainsi que des pages web archives. Elle travaille fournir des services plus spcialiss lis l'enseignement et la formation et l'accs aux collections par des personnes prsentant un handicap.

V.

LE GRAMOPHONE VIRTUEL

Enregistrements historiques canadiens, site Web multimdia en pleine croissance consacr aux dbuts de l'enregistrement sonore au Canada. Dot d'une base de donnes d'images et d'enregistrements audionumriques canadiens, ainsi que de biographies de musiciens et d'un rsum de l'histoire de la musique et de l'enregistrement sonore au Canada, Le Gramophone virtuel offre aux chercheurs et aux mordus de musique un aperu dtaill de l'poque des 78 tours au Canada.17

VI.

EXEMPLES D'INTERFACES DE CONSULTATION

L'extraordinaire Cit de Dieu par la Bibliothque municipale de Nantes18, voir pour le ralisme du tourner de pages et pour le zoom trs puissant. Online Gallery19, projet de la British Library, ce magnifique exemple pousse le dtail trs loin : c'est la souris qu'on tourne les pages de superbes manuscrits.

13 14 15 16 17 18 19

http://gallica.bnf.fr/content?lang=fr#stats http://www.numdam.org (visit le 19/07/2007) http://www.numdam.org/spip.php?rubrique4 (visit le 28/8/2009) http://www.archive.org (visit le 19/07/2007) http://www.collectionscanada.ca/gramophone/index-f.html (visit le 19/07/2007) http://arkhenum.picturelan.com/bm_nantes_oeb/ (visitle19/07/2007) http://www.bl.uk/onlinegallery/ttp/ttpbooks.html (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 7/84

Deux exemples d'utilisation d'une loupe magique (retranscrivant le texte issu d'critures manuscrites) : le Journal de Martha Ballard20 et Bill of sale for slave named Kate21. Multi-touch screen interface demonstration22 : Fluidbook23 : une interface spcialise dans la prsentation de catalogues.

VII.

LISTES DE BIBLIOTHQUES NUMRIQUES

D'aprs l'excellent article24 du blog Figoblog : List of digital library projects25 Liste internationale du blog NetBib26 The British Columbia International Digital Library27, une liste de listes A selection of web accessible collections28 (Harvard University Library)

3.a.I.

La numrisation ?Quelques dfinitionsUN SIGNAL ANALOGIQUE

Un signal analogique est un signal qui reproduit l'analogue (qui transpose) un phnomne physique, tel qu'une onde mcanique (pour le son) ou une onde lectromagntique (pour l'image) ou une combinaison des deux (pour la vido). C'est une fonction continue dans le temps et/ou dans l'espace. Remarquez que les signaux analogiques numriser ne sont pas forcment perus par nos sens : on peut numriser par exemple le chant des baleines dont les frquences ne se situent pas dans l'intervalle de celles perues par l'homme (20 Hz 20 kHz environ). Exemple : analyse d'un signal analogique audio. On analyse le signal audio reproduit par un systme analogique (radio FM, platine disque 33 tours, ...) et on reprsente ici la puissance instantane du signal en fonction du temps, tout d'abord en vue gnrale, puis en vue agrandie pour voir quoi ressemble le signal.

20 21 22 23 24 25 26 27 28

http://dohistory.org/diary/exercises/lens/ (visit le 19/07/2007) http://memorialhall.mass.edu/activities/media.jsp?itemid=7797&img=0 (visit le 19/07/2007) http://www.youtube.com/watch?v=89sz8ExZndc (visit le 19/07/2007) http://www.fluidbook.com/demo/fr/ (visit le 28/08/2009) http://www.figoblog.org/document933.php http://en.wikipedia.org/wiki/List_of_digital_library_projects (visit le 19/07/2007) http://wiki.netbib.de/coma/DigiMisc (visit le 19/07/2007) http://bcdlib.tc.ca/ (visit le 19/07/2007) http://digitalcollections.harvard.edu/ (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 8/84

Illustration 1: Signal audio - vue gnrale

Puis on zomme sur une partie du signal ...

Illustration 2: Signal audio - vue agrandie

II.

LA NUMRISATION

La numrisation est la conversion d'un signal analogique en un signal numrique en fonction de deux paramtres : l'chantillonnage et la quantification29. C'est conceptuellement une modlisation mathmatique de la ralit. Note terminologique : le terme anglais est digitization, d'o vient le franglais digitalisation qui est proscrire. La numrisation d'une image est parfois effectue l'aide d'un scanner. On parle alors, toujours improprement d'un scan , d'un scannage , scannrisation , etc... A proscrire galement !

III.

L'CHANTILLONNAGE

L'chantillonnage consiste remplacer une fonction continue dans le temps ou dans l'espace par la suite des valeurs qu'elle prend en des instants ou des zones discret(e)s priodiques. Ces valeurs suffiront pour reconstituer la fonction dans une tape ultrieure.

29 On considre ici le processus Pulse-code modulation (PCM). Cf http://en.wikipedia.org/wiki/Pulse-code_modulation pour plus d'explications. D'autres processus de numrisation existent, plus complexes, et ne seront pas examins dans le cadre de ce cours.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 9/84

L'exemple classique est celui du stroboscope, qui permet de dcomposer les mouvements (en fait de les chantillonner) : 1. 2. 3. le flash claire la piste de danse pendant un temps trs court et l'il reoit une image des danseurs immobiles . La priode suivante est dans l'obscurit, aucun signal n'est reu par l'il qui, par un phnomne de rmanence, retient l'image fixe reue prcdemment. L'clair suivant rajuste l'image des danseurs dans une position lgrement diffrente (car la danse est analogique, une fonction continue dans le temps et dans l'espace !) et la sensation est celle d'un mouvement saccad.

La mesure effectue un instant/lieu donn est appele un chantillon. Prenons un autre exemple : imaginons qu'on veuille numriser l'image d'un parterre de fleurs. On commence par quadriller l'image et on dtermine la couleur de chaque carr. Chaque carr est appel chantillon. Pour faire le travail correctement, on la quadrille de faon suffisamment fine de manire ce que dans chaque petit carr on ne trouve qu'une couleur (environ).

IV.

LA QUANTIFICATION

Poursuivons l'exemple de la numrisation de l'image d'un parterre de fleurs. Il faut maintenant dcider de la faon de mmoriser la couleur dans chaque carr. 1. 2. 3. 4. On se dfinit un ensemble limit de couleurs permises, par exemple : {0rouge, 1bleu, 2vert, 3jaune}. En fonction du lieu de mesure, on relve la couleur. Si cette couleur se rapproche d'un vert, on choisit la valeur vert , si la couleur est plus proche d'un jaune, on choisit jaune . On a le choix ici entre 4 valeurs. Une fois tous les chantillons analyss et un choix de valeur effectu pour chacun, on dispose d'une numrisation de l'image du parterre de fleurs ... en quatre couleurs. Le rsultat sera sans doute mdiocre, comme vous pouvez l'imaginer !

Calculons la place ncessaire pour enregistrer cette information. On dispose de 4 valeurs donnes, et l'information se code en binaire en informatique (base 2, seuls les chiffres 0 et 1 sont autoriss). Il faudra donc un nombre binaire deux chiffres (22=4) pour coder le choix : 0rouge 1bleu 2vert 3jaune cod cod cod cod 00 01 10 11

Ce nombre binaire deux chiffres, exprim en bits, permet de coder la valeur permise pour un chantillon. L'enregistrement de l'information issue de la numrisation de ce parterre de fleurs ncessite donc 2 bits par chantillon. La taille du fichier (en bits) issu de la numrisation est donc de 2 x nombre d'chantillons. On comprend immdiatement dans cet exemple que... ... plus le nombre de valeurs permises est important, ... ... plus fidle est l'enregistrement du signal. On comprend aussi que ... ... plus l'on choisit de valeurs permises, ... ... plus il faudra de place pour stocker, dans chaque chantillon, la valeur choisie. Si maintenant on choisit un nombre de valeurs permises plus important, par exemple 1024 valeurs, (codes en 10 bits car 210=1024), la taille finale de la numrisation sera 5 fois plus importante, et le rsultat obtenu beaucoup plus fidle.Cours numrisation (c) JMM 2011-2012 version du 16/12/11 page 10/84

La quantification est l'opration par laquelle on examine l'chantillon mesur et l'on choisit la valeur la plus proche mmoriser parmi un ensemble prdfini des valeurs permises.

V.

UN DOCUMENT NUMRIQUE

Un document numrique est un fichier informatique (donc reprsent par une suite de 0 et de 1) dont le contenu, structur selon les spcifications d'un format de fichier, reprsente une information comprhensible par un humain et/ou par un ordinateur.

b.

Un Exemple

Prenons la numrisation d'un signal audio (agrandi depuis les illustrations prcdentes). En ordonne on indique la puissance instantane du signal, en abscisse le temps. Le signal se prsente ainsi :

on chantillonne ce signal une frquence donne : c'est un dcoupage temporel.

... et on mesure la valeur du signal chaque dcoupe.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 11/84

chaque intersection, on prend la valeur en ordonne. On obtient donc une srie de valeurs comme dans le tableau suivant (donnes compltement fictives) dans lequel on mesure chaque milliseconde une valeur (VM) (par exemple lectrique).

T 0 (ms) VM 763

1 783

2 874

3 885

4 910

5 921

6 911

7 917

8 903

9 901

10 902

11 904

12 876

... ...

Chaque valeur mesure est ensuite ramene la valeur autorise la plus proche.

Dans le tableau suivant, (rappel, en donnes fictives) on compare les valeurs mesures (VM) avec les valeurs autorises et on choisit les valeurs autorises les plus proches (VC) (ici les multiples de 10). En vert sont reprsentes les valeurs qui ne changent pas (ou peu) par cette opration, en rouge celles qui changent beaucoup.

T (ms) VM VC diff.

0 763 760 3

1 783 780 3

2 874 870 4

3 885 890 5

4 910 910 0

5 921 920 1

6 911 910 1

7 917 920 3

8 903 900 3

9 901 900 1

10 902 900 2

11 904 900 4

12 876 880 4

... ... ...

Les valeurs autorises sont celles qui sont sauvegardes dans le fichier numrique. C'est la modlisation numrique du signal analogique initial. Un fichier numrique en rsulte.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 12/84

Effectuons maintenant l'opration inverse, celle de la reproduction de ce signal numris. Comme le dispositif humain de perception des sons est analogique, il faut reconvertir ce signal numris en signal analogique. La suite de valeurs numriques est donc convertie en un nouveau signal analogique :

... qu'on peut comparer avec le signal analogique initial pour faire apparatre les approximations et les erreurs dues la numrisation :

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 13/84

Les facteurs qui influent sur la qualit de la modlisation de ce signal sont de deux ordres : Le frquence d'chantillonnage et la prcision de la quantification.

I.

LA FRQUENCE D'CHANTILLONNAGE.

Elle s'exprime en Hertz, l'inverse de la seconde. Plus celle-ci est leve (plus la priode est faible), meilleure est la prise en compte des vnements rapides, et meilleure est la fidlit du signal numrique par rapport au signal analogique. Mais comment choisir cette frquence ? En pratique, on applique le thorme de Shannon (certains disent qu'il s'agit de celui de Nyquist) qui prcise que la frquence minimale d'chantillonnage d'un signal doit tre au moins le double de la frquence maximale contenue dans le signal chantillonner. Soit ech la frquence d'chantillonnage, et thorme stipule que :

F

Fmax_signal la frquence maximale du signal numriser, ce

Fech2*Fmax_signalAutre formulation : Pour ne pas perdre d'information dans un signal la distance entre deux chantillons doit tre infrieure la demi-priode du signal. Ce thorme peut tre appliqu aux images : pour ne pas perdre de dtails dans une image, la taille des pixels doit tre moins de la moiti du plus petit dtail de l'image. Exemple pour la musique, la frquence maximale audible est de 20 kHz, en comptant trs large. La frquence d'chantillonnage des CD-audio, de 44,1 kHz, plus du double de 20, respecte bien ce thorme. Application la voix en tlphonie : frquence maximale : 3700 Hz. Quelle frquence d'chantillonnage minimale choisir ?

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 14/84

II.

LE SOUS-CHANTILLONNAGE

On parle de sous-chantillonnage si la frquence d'chantillonnage n'est pas suffisante pour reprsenter de faon adquate le signal. Le rsultat issu d'une reconversion en analogique n'a alors plus rien voir avec le signal de dpart. Pour une numrisation audio, cela peut se traduire par de forts chos, des repliements de bandes, etc. trs audibles.

Dans le schma ci-dessus, le signal d'origine est numris avec un chantillonnage trop faible. Le signal qui est reconstruit partir de la numrisation est notoirement diffrent du signal original. l'inverse, un surchantillonnage consiste prendre trop d'information, beaucoup plus qu'il n'en faut pour reprsenter de faon adquate le signal analogique. Il n'en rsulte pas forcment une meilleure qualit sonore dtectable, mais en tout cas une quantit de donnes beaucoup plus importante traiter.

III.

LA PRCISION DE LA QUANTIFICATION.

Elle doit tre adapte au signal numris, c'est--dire que la valeur analogique maximale du signal numriser doit tre code par la valeur numrique maximale, idem pour les valeurs minimales. Plus elle comprend de valeurs diffrentes, plus le codage sera prcis, ... mais plus l'information sera volumineuse stocker. Exemple : le signal audio d'un CD-audio est cod sur 16 bits sur chaque voie, soit valeurs chaque chantillon strophonique.

22 =265536

16

Exercice : calculer la taille non compresse d'un morceau de musique de 3 minutes cod sur un CD-audio : 3x60 = 180 secondes Chaque seconde, le signal est code 44100 fois sur 2 fois 16 bits. La taille du morceau est donc de : 180x44100x2x2 soit environ 30 Mo !

Exercice 2 : combien peut-on placer de minutes de musique sur un CD-audio ?

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 15/84

B.1.a.I.

La numrisation des sonsLe mcanisme de l'auditionQu'est-ce que le son ?DE LA VIBRATION NAIT LE SON :

Phnomne moins vident saisir que pour les images, il est ncessaire de rappeler quelques notions de base sur le son. Le son est cr lorsqu'un objet vibrant transmet sa vibration l'air ambiant. Le son se propage dans l'air travers de multiples collisions entre les particules. Admettons qu'on ait un haut-parleur et que celui-ci soit notre source sonore. La membrane du haut-parleur se dplace en avant et en arrire suivant l'ampleur du signal lectrique qui est appliqu l'inducteur sur lequel il s'appuie. Ainsi, il dplace les particules de l'air d'abord en les comprimant puis en les dilatant :30

Illustration 3 : Compression (C= compression) et Dilatation (ou Rarfaction) (R= rarfaction) des particules d'air

Suivons la propagation du son partir de la source (le haut-parleur). Pour tre plus clair nous supposerons d'abord qu'une compression se produit vers la droite, puis une dilatation vers la gauche :

Illustration 4 : Mouvement du haut-parleur

La membrane du haut-parleur se dplace et pousse les particules de l'air qui se trouvent droite en provoquant une compression. Celles-ci leur tour vont dplacer les particules qui sont proches en leur transmettant l'nergie reue du haut-parleur. Aprs quoi la membrane revient en arrire et provoque une compression sur le ct oppos, soit une dilatation vers la gauche, et de ce fait cre devant lui une dpression qui sera colmate par les particules d'air se trouvant proximit. Ces particules qui se dplacent crent leur tour une dpression leur droite et ainsi de suite. Ce procd fait en sorte que les particules transmettent l'nergie en oscillant et non pas en se dplaant physiquement dans la direction de la propagation du son. Si le haut-parleur est pilot par un signal sinusodal, la pression atmosphrique immdiate aura le parcours dcrit dans la figure ci-aprs :

30 http://www.audiosonica.com/fr/cours/post/5/Theorie_du_son_Propagation_du_son visit le vendredi 9 septembre 2011 (pour ce paragraphe et les suivants)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 16/84

Illustration 5 : Cheminement sinusodal de la pression atmosphrique

La vibration de l'air se propage alors et atteint nos oreilles, o elle fait vibrer nos tympans. L'oreille interne transforme alors cette information mcanique en signaux lectriques que le cerveau sait interprter. Le son est donc une grandeur analogique qu'il convient de transformer si on veut la stocker pour la reproduire. C'est le rle du microphone (qui transforme la vibration acoustique en un signal lectrique), puis du pramplificateur (qui amplifie le niveau lectrique extrmement faible du microphone).

II.

ENREGISTREMENT ANALOGIQUE:

Pendant de nombreuses annes, la seule technologie connue tait l'enregistrement analogique du son. Enregistrements sur des cylindres, puis des disques en cire et en vinyle, et enfin sur des bandes magntiques. La technologie analogique a atteint ses limites dans les annes 80. Les dispositifs existants ne permettaient plus d'amlioration significative de la qualit, notamment l'augmentation de la dynamique (le rapport entre le son le plus fort et le son le plus faible dans un mme enregistrement) et la diminution du bruit de fond. Historique rapide de l'enregistrement des sons31 : 1807 : L'amricain Thomas Young invente un instrument capable d'inscrire les variations acoustiques sur la surface d'un cylindre couvert de suie. En 1857, Lon Scott de Martinville perfectionne ce procd et invente un appareil, le Phonautographe, constitu d'une membrane vibrante, place au bout d'un tube acoustique, qui transmet les vibrations sonores un stylet qui les grave sur un cylindre enduit de noir de fume. Mais ce dispositif ne permet pas de relire les courbes ainsi dessines. 1877 : Thomas Edison construit le premier systme permettant l'enregistrement et la reproduction des sons, le phonographe. La transformation entre les ondes acoustiques et les informations enregistres tait accomplie par la gravure d'une feuille d'aluminium recouvrant un cylindre rotatif. Il prend de cours Charles Cros qui avait quelques mois plus tt dpos un brevet pour un appareil similaire. 1887 : l'Allemand Emile Berliner, migr aux Etats-Unis, met au point le gramophone, avec son disque plat en zinc enduit de cire que l'on grave avec un burin mtallique. On attaque ensuite l'acide chromique le zinc qui a t mis nu par la gravure. Ce disque peut alors tre facilement reproduit en un nombre infini de copies en fabricant un moule par galvanoplastie. Le disque tourne 78 tours par minute. Cylindre contre disque plat, c'est la premire guerre des formats. 1889 : Le premier enregistrement magntique est ralis par le physicien Danois Valdeman Poulsen. Cet appareil, le "Tlgraphon", utilise un cble d'acier enroul hlicodalement autour d'un cylindre tournant sous un lectro-aimant, connect un microphone au charbon ou un casque. En 1900, il remporte le Grand Prix de l'Exposition universelle, mais comme on ne sait pas encore amplifier le signal lectrique, le son de l'appareil est trop faible pour tre utilis pour la musique. On l'utilise comme dictaphone et, partir de 1925, comme rpondeur tlphonique. Accessoirement, la marine allemande s'en sert galement pour envoyer des messages cods durant la I guerre mondiale En 1893, Berliner fonde aux USA la Gramophone Company. En 1895, la compagnie des chemins de fer de Pennsylvanie investit la somme de 25 000 dollars dans ce nouveau support, ce qui permet Berliner de perfectionner sa machine et de la lancer commercialement ds 1896. Le succs est norme ; deux ans plus tard, il se vend pour un million de dollars de gramophones aux USA. En 1898, Berliner et ses associs fondent en Angleterre The Gramophone Company, qui deviendra His Master's Voice puis E.M.I. ; en Allemagne la Deutsche Grammophon Gesellschaft est la premire usine au monde spcialise dans le pressage des disques ; et l'anne suivante en France la Compagnie Franaise du Gramophone.

31 Lire la surprenante histoire de l'enregistrement sonore http://www.questmachine.org/article/Histoire_de_l_enregistrement_sonore visit levendredi 9 septembre 2011. une partie des explications ci-dessous est directement tire de cette ressource.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 17/84

En 1904, l'usine de Hanovre presse 25 000 disques par jour et le catalogue contient dj plus de 5000 titres, en 1929 elle fabrique 10 millions de disques par an ! 1905-1926 : L'industrie du 78-tours croit rapidement, et la recherche sur l'enregistrement magntique pitine. Ds 1920, premiers essais d'enregistrement en strophonie, peu exploitables. 1931 : En Allemagne, Pfleumer et AEG conoivent et utilisent le premier magntophone avec une bande similaire ceux d'aujourd'hui. 1948 : les firmes Columbia et RCA-Victor prsentent leurs disques microsillon sur disque vinyle : celui de Columbia a 30 cm de diamtre et tourne 33 1/3 tours-minute ; celui de RCA a 17,5 cm de diamtre et tourne 45 tours-minute. 1948 : L'utilisation des magntophones devient plus courante, mais ils sont toujours lourds et encombrants. Les magntophones mobiles sont installs dans des camions. 1949 : disque microsillon en vinyle, commercialis en France. Avec un sillon trois fois plus fin que celui du 78 tours, il permet une dure de 20 30 minutes par face au lieu de 3 4'30 maximum. Fabriqu en PVC, il est aussi nettement moins bruyant que les disques en gomme-laque (5,6 fois plus de dynamique). Les derniers 78 tours sont fabriqus en 1956. 1955 : Lancement des magntophones strophoniques. 1957 : vente des premiers disques strophoniques 1974 : Les premiers magntophones numriques PCM pour instrumentation font leur apparition. 1979 : Les firmes Philips, Sony et Hitachi prsentent le Compact Disc (CD), marque dpose, qui remplacera petit petit le disque microsillon. 1983 : Le DAT (magntophone numrique) est annonc par la firme Sony (la commercialisation sera faite en 1987). 1992 : Sony prsente le MiniDisc numrique et Philips commercialise la Digital Compact Cassette, cette dernire devant prendre la suite de la Compact Cassette (CC). 1995/96 : Apparition des premiers graveurs de CD-R vendus dans le grand-public, puis des disques CDRW renregistrables (disques magnto-optiques). 1998 : Premier microphone numrique (Beyer).

III.

ENREGISTREMENT NUMRIQUE

C'est au cours des annes 80 que la numrisation du son a progressivement envahi les studios d'enregistrement, puis s'est installe chez l'utilisateur final. Les ordinateurs multimdias modernes permettent de donner un nouvel intrt au son numrique, puisqu'il devient possible d'enregistrer des sons moindre frais sur son disque dur ou sur un CD enregistrable. Le tout est de savoir comment s'y prendre, car le numrique n'est pas un gage de qualit en soi. Un enregistrement rat restera toujours un enregistrement rat... ft-il numrique !

2.

Les diffrents types de documents analogiques "sons" numriser

Des enregistrements sur tous types de supports : disques vinyles 78, 45 et 33 tours/min (1899 1960s) cassettes audio et micro cassettes (1965 Present) bandes (6,25 et 6,35 mm, 1,2 - 2,4 - 4,75 - 9,5 - 19 cm/s, 2 et 4 pistes - c. 1945 Prsent) cylindres32 de cire (2 4 minutes d'enregistrement - 1888 1929) fil magntique (15 30 minutes d'enregistrement - c. 1945 1955) son des vido (Hi8, Video 8, DV) ...

32 http://cylinders.library.ucsb.edu/ (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 18/84

Sans oublier les vnements live !

3.a.

Les concepts de base (Dfinitions/Vocabulaire)Numrisation d'un son

Voir les prconisations du rapport Best Practices For Audio Preservation 33 pour complter les informations ci-dessous. Comme nous l'avons dfini dans l'introduction du cours, le son numriser doit tre chantillonn et quantifi.

I.

L'CHANTILLONNAGE D'UN SON

Le son doit tre chantillonn une frquence au minimum suprieure au double de la frquence maximale contenue dans le signal analogique (thorme de Shannon). Notre oreille peroit les sons jusqu 20 kHz (au grand maximum et partir de l'adolescence, a ne cesse de baisser). Donc la frquence d'chantillonnage doit tre au moins de l'ordre de 40 000 Hz. Quand ce n'est pas le cas, comme on le verra ci-dessous, il est indispensable de supprimer les frquences suprieures la moiti de l'chantillonnage prvu, par un filtre passe-bas. Seules les frquences infrieures une valeur fixe seront transmises au sortir du filtre. On parle aussi de limitation de la bande passante . Frquences d'chantillonnage normalises : 32 kHz : pour la radio FM en numrique (bande-passante limite 15 kHz) 44.1 kHz : pour l'audio professionnelle et les compact-disques 48 kHz : pour les enregistreurs numriques multipistes professionnels et l'enregistrement grand public (DAT, MiniDisc). 96 kHz (en 5.1) : norme pour le DVD-Audio.

II.

LA QUANTIFICATION D'UN SON

Plus le nombre de bits utilis pour le codage sera grand, meilleure sera la ressemblance avec le signal original. Les systmes grand-public actuels (CD, DAT) travaillent avec 16 bits, soient 65536 niveaux. Le standard du DVD audio et des nouvelles machines professionnelles est de 24 bits 96 kHz. Ces caractristiques permettent encore d'amliorer la dynamique et la bande-passante des signaux audio, une reproduction encore plus proche de la ralit, ainsi que la possibilit de se livrer des traitements numriques plus sophistiqus. Comparaison des formats CD-Audio et DVD-Audio34 :

CD-audio Capacit Nombre de canaux Dure denregistrement Nature du signal audio Frquence d'chantillonnage 640 Mo 2 (stro) 74 minutes PCM35 44, 1 kHz

DVD-audio 4,7 Go 26 74 min en 6 canaux PCM et MLP36 Jusqu 192 kHz

33 34 35 36

http://www.dlib.indiana.edu/projects/sounddirections/papersPresent/sd_bp_07.pdf (visit le 24/07/2008) http://www.son-video.com/Conseil/Hifi/DVDAudio.html (visit le 19/07/2007) http://en.wikipedia.org/wiki/PCM (visit le 19/07/2007) http://en.wikipedia.org/wiki/Meridian_Lossless_Packing (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 19/84

CD-audio Dbit 1,4 Mbps

DVD-audio 9,6 Mbps

Le concurrent du DVD-Audio est le Super-Audio CD dont les performances sont comparables mais les technologies sont diffrentes et incompatibles. Jusqu' preuve du contraire, les lecteurs aussi sont incompatibles. [Mise jour du 26/07/2011 : ni l'un ni l'autre des formats ne semble avoir connu de succs. L'heure est d'ailleurs la dmatrialisation des supports, c'est--dire qu'on s'en passe...] Quel format employer en fonction de la qualit souhaite ? Type d'enregistrement Qualit souhaite Studio / Master CD Musique strophonique Archive qualit CD Assez bonne qualit pour transmission sur Internet Studio / Master CD Voix ou musique mono Archive qualit CD Assez bonne qualit pour transmission sur Internet Son type "tlphone" Format employer 48~96 KHz - 16~24 bits linaire - stro 44,1 KHz - 16 bits linaire - stro 44,1 KHz - 16 bits - MPeg 256K - Stro 32 KHz - 16 bits - MPeg 128K Stro-joint 48~96 KHz - 16~24 bits linaire - mono 44,1 KHz - 16 bits linaire - mono 44,1 KHz - 16 bits - MPeg 128K - mono 32 KHz - 16 bits - MPeg 64K mono 16 KHz - 8 bits - Mono

La taille mmoire occupe par du son numrique : Un enregistrement de qualit CD (44,1 kHz, 16 bits stro) occupe 1,4 Mbits/s soit environ 10 Mo / min

la diffrence des images, les sons numriques doivent subir un processus de reconversion en valeurs lectriques analogiques pour pouvoir tre reprsents. Les images, elles, peuvent tre constitues directement de pixels de valeurs de couleurs ponctuellement trs prcises et correspondant directement l'information numrique. Pour le son, on ne peut pas se passer de microphones, d'enceintes ou de casques.

b.I.

La mesure des sonsLES FRQUENCES DES SONS

Les frquences des signaux sonores se mesurent en Hz, et sont l'inverse de la longueur d'onde du signal. Si vous avez d'excellentes oreilles, les limites frquentielles de votre spectre d'audition s'tendront de 20Hz (vers le grave) jusqu' 15-20kHz (dans les aigus). Attention, notre audition nest pas aussi transparente quon pourrait le croire : nous avons l'impression d'entendre aussi bien les sons aigus, que le mdium ou les graves mais ce n'est pas le cas. L'oreille est trs sensible aux alentours de 2,8-3 kHz, ce qui n'est pas un hasard puisque c'est la frquence moyenne de la voix humaine37. Important : il n'y a aucune raison de limiter la numrisation de l'audio aux frquences et puissances admises et reconnues par l'oreille humaine. Les infra sons et surtout les ultrasons peuvent parfaitement tre capts et numriss. Il faudra simplement un dispositif de transcodage (visuel ou audio) pour les rendre accessibles aux humains.37 http://www.restauration-audio.com/Les-traitements-psychoacoustiques_a22.html (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 20/84

II.

LES DCIBELS

(Source38). C'est un fait d'exprience ... nos sensations physiques " varient peu " lorsque la grandeur provoquant la stimulation " varie beaucoup ". Fait surprenant mais vrifiable : lorsque nous doublons la puissance d'un appareil producteur de son, c'est peine si nous nous apercevons de l'augmentation de volume ! C'est l'quipe de Graham Bell qui, pour la premire fois de l'histoire, a dvelopp une technique dont l'aboutissement tait l'apprciation de l'un des sens humains : l'audition. Il fallait s'adapter et l'on chercha une fonction qui, comme les sensations, varie peu quand la variable varie beaucoup. Tous les types de logarithmes rpondent ce critre, en particulier le logarithme dcimal. Observons qu'il s'agit, non pas de mesurer, mais de comparer deux sensations. Ds lors, on tablit cette comparaison en prenant le logarithme du rapport des puissances (au sens de la physique) des grandeurs qui provoquent les deux sensations. Ce nombre, cens reprsenter une diffrence de sensations, est donn en Bel, en hommage Graham Bell.

Ecart de sensations en dciBel (dB) =

1 0log

P2 P1

Jusqu'ici, les dcibels ont servi mesurer des variations d'une grandeur. Ils peuvent servir reprer le niveau d'une grandeur physique par rapport un repre appel 0 dB et choisi par pure convention. La puissance sonore (en mW) qui correspond 0 dB rsulte d'une convention internationale. C'est la puissance considre comme minima de perception par un chantillon moyen de population. Cette dfinition est trs arbitraire et dpend la fois des conditions de vie des personnes (campagne calme ou ville bruyante) et du type de bruit considr (stridences, bruit sourd des autos, ptarades etc.). La mesure de la pression acoustique se fait en dcibel (dB)39

La formule

10 log

acoustique multiplie par 10. La valeur de rfrence est le seuil de l'audition (un moustique volant 3 mtres de notre oreille). Le seuil de l'audition est fix 0dB, le seuil de la douleur est de 120dB. Pour bien comprendre ce que signifient ces chiffres, la pression acoustique est multiplie par un facteur de 1000 milliards entre 0 et 120 dB. Quelques chiffres sur les intensits sonores : 0 dB : seuil d'audibilit De 0 10 dB : dsert De 10 20 dB : cabine de prise de son De 20 30 dB : conversation voix basses, chuchotement De 30 40 dB : fort De 40 50 dB : bibliothque, lave-vaisselle De 50 60 dB : lave-linge De 60 70 dB : sche-linge, sonnerie de tlphone, tlviseur, conversation courante De 70 80 dB : aspirateur, restaurant bruyant De 80 90 dB : tondeuse gazon, klaxon de voiture De 90 100 dB : route circulation dense, trononneuse, atelier de forgeage De 100 110 dB : marteau-piqueur moins de 5 mtres dans une rue, discothque De 110 120 dB : tonnerre, atelier de chaudronnerie 120 dB : seuil de la douleur De 120 130 dB : sirne d'un vhicule de pompier, avion au dcollage ( 300 mtres) , concert amplifi 180 dB : dcollage de la fuse Ariane, lancement d'une roquette 194 dB : son le plus bruyant possible Source : wikipedia40

P2 P1

signifie qu'une augmentation d'un dciBel correspond une pression

38 http://perso.orange.fr/arsene.perez-mas/signal/decibels/decibels.html (visit le 19/07/2007) 39 http://en.wikipedia.org/wiki/Decibels (visit le 19/07/2007) 40 http://fr.wikipedia.org/wiki/D%C3%A9cibel (visit le 25/09/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 21/84

III.

DYNAMIQUE D'UN SON ET SA COMPRESSION

Attention de ne pas confondre compression dynamique des sons avec la compression informatique (voir ciaprs). La dynamique (audio) c'est l'cart existant entre le son le plus faible et le plus fort dans un morceau. La 9e symphonie de Beethoven est connue pour tre l'une des uvres de la musique classique ayant la plus grande dynamique. Cela signifie que dans cette uvre il existe des passages qui sont extrmement doux (pianissimo) et d'autres au contraire extrmement forts (fortissimo). Il est possible suivant les interprtations et les effectifs qu'en concert les 100 dB de dynamique soient dpasss, ce qui est norme. La compression dynamique audio consiste rduire artificiellement cette dynamique, cet cart entre les sons faibles et les sons forts. Une srie d'articles de blog retrace l'histoire de la compression dynamique du son enregistr et diffus. C'est passionnant mais cela dpasse largement la porte de ce cours41.

c.

La visualisation d'un son

Outre l'coute, le travail sur un son sera grandement facilit par les techniques permettant de le visualiser...

I.

VOIR LA PUISSANCE DU SON EN FONCTION DU TEMPS

En utilisant Audacity, on peut visualiser un graphique reprsentant la puissance acoustique en fonction du temps. Les zones faiblement actives reprsentent des silences.

II.

VOIR LA DISTRIBUTION INSTANTANE DES FRQUENCES D'UN SON

D'autres visualisations sont possibles, par exemple un diagramme frquence instantan : chaque colonne reprsente un chantillon temporel du son, l'intensit de chaque frquence est rendue par la valeur de luminosit.

41 http://blog.formations-musique.com/index.php?post/2009/04/02/49-sommaire-de-l-histoire-de-la-compression-dynamique-audio (visit le 20/8/2010)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 22/84

... et un sonagramme qui reprsente en dynamique quelles frquences sont prsentes dans un signal un instant prcis :

4.C h a d e tr n e ite e a m tn m r e s n u u u n iq d o n : r e u u te iq p g a lo C a S to , e g a k c tlu u q g s a e m n ia h n p o o lc r d e ic e r m ,t tu a m T tr ite s u o n p tu h d s n a r l n : a e r u te iq c g u o A C T N C A A n m ite a A r N A q g o tn lifc p r m u a e o lin p m fic a q g r u te a d n O r n o s e 1 0 1 1 0 0 1 1 0 0 1 1 0 0 1 D o lo e e in u a iq mg i a m u mu o e D n iq r e D e u in iq a g m lo o a e O n e d s o e r n m u a iq tis g r lo e a v n n r o u C e i g u lo tis a r m e u v n n C o q

La prsentation de la chane numrique

On peut reprsenter la chane de traitement numrique par le schma suivant :

Pour un expos complet des meilleures pratiques de numrisation des sons, cf Capturing Analog Sound for Digital Preservation: Report of a Roundtable Discussion of Best Practices for Transferring Analog Discs and Tapes, March 2006 42 voir aussi, en franais, l'article Numrisez vos vinyles grce GarageBand 43

42 http://www.clir.org/pubs/reports/pub137/pub137.pdf 43 http://www.cuk.ch/articles/3040 (visit le 29/08/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 23/84

5.

Les matriels et logiciels

Voir sur le site d'un passionn de restauration numrique une liste d'appareils de niveau professionnel44.

a.I.

La lecturePOUR LES DISQUES

Ncessite un capteur de la meilleure qualit possible et un support analogique le plus propre possible. Il existe des appareils spcialiss : la KEITH MONKS cleaning machine. Machine professionnelle destine nettoyer en profondeur les 78 tours et les vinyles. Il existe des platines disques professionnelles, telles que : la Platine tourne disques Bang & Olufsen BEOGRAM 4002 bras tangentiel. Platine tourne disques professionnelle STANTON avec un choix de plusieurs cellules et diamants de diffrentes tailles, pour s'adapter le mieux possible aux caractristiques du sillon lire. Possibilit de lecture l'envers, souvent utile pour les sillons fatigus d'tre lus l'endroit...

II.

POUR LES BANDES

La rfrence reste le STUDER REVOX PR99. Machine professionnelle de fabrication Suisse, la plus utilise dans les radios et les studios d'enregistrement avant le passage au numrique. 2 pistes. Vitesses 19 et 38 cm/s.

b.

La pr-amplification

Le pramplificateur effectue un premier traitement analogique sur le son (cette tape inclut les oprations de mixage dont la complexit dpasse le cadre de ce cours). On branche ensuite le pramplificateur l'entre line-in de la carte son de l'ordinateur (o, pour des projets trs pointus, on branche un Convertisseur Analogique Numrique externe)

c.

Les logiciels d'enregistrements

Un logiciel spcialis intervient alors pour numriser le son entrant dans l'ordinateur (rglages effectuer pour la qualit de l'chantillonnage et de la quantification). Par exemple on peut employer Audacity, logiciel Open Source, multi-plate formes et trs complet permettant d'effectuer toutes sortes de traitements. Des experts utilisent Audacity pour numriser professionnellement des sons. Voir l'excellent article Digitizing records and tapes with Audacity 45 Par contre, la rfrence reste Pro Tools HD distribu par DIGIDESIGN. diteur audio rput dans tous les studios du monde.

d.

Le traitement

Vise supprimer les silences non dsirs, nettoyer l'enregistrement d'ventuels cracks , filtrer les frquences contenant trop de souffle, etc... Des logiciels trs spcialiss permettent d'effectuer ces oprations trs coteuses en temps de faon semi-automatique. Exemple : CEDAR DC1 Declicker. Capable d'effectuer 50 millions d'oprations la seconde ce qui lui permet d'radiquer plus de 2500 "scratches" ou "clicks" par seconde. Systme coteux mais un des meilleurs. Aural exiter APHEX 204. Permet de redonner de l'paisseur, de la brillance et ses harmoniques natives un enregistrement analogique altr par le temps et l'usure des lectures.

Il est possible d'couter des exemples sonores46 de restauration47.

44 45 46 47

http://www.restauration-audio.com/L-equipement-audio-du-studio-LRA_a6.html (visit le 20/8/2010) http://www.linux.com/articles/119550 (visit le 17/06/2008) http://www.restauration-audio.com/index.php?action=article&id_article=174099 (visit le 19/07/2007) http://www.restauration-audio.com/Qu-est-ce-que-la-restauration-sonore-_a13.html (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 24/84

Les logiciels d'dition audio classiques peuvent aussi restaurer et amliorer les sons numriss. Consultez le guide de restauration audio sur le site digitalFAQ48 et les fonctions utiles d'Audacity49.

6.a.

Enregistrement et compression de l'audioIntroduction sur la taille des fichiers audio non compresss

Ci-dessous un tableau des tailles de fichiers non compresss en fonction de la qualit de la numrisation voulue. On comprends vite la ncessit de trouver un moyen d'en rduire la taille. Qualit Tlphone Radio Radio CD Audio Echantillonnage (kHz) 11 22 22 44 Quantification (bits) 8 8 16 16 Mono/Stro mono stro stro stro Taille (1 min, en Ko) 660 2560 5120 10 240

Les formats audio sont multiples et il est parfois difficile de s'y reprer. Consultez un tableau complet50 et trs document sur le site Sustainability of Digital Formats Planning for Library of Congress Collections .

b.

Notion de CODEC

Un codec est un programme informatique charg de COder un fichier numrique d'un format un autre, souvent plus lger. Il est aussi charg, dans l'autre sens, de DECoder le fichier encod. La notion de CODEC n'est pas la mme que celle du format de fichier : un unique format de fichier (exemple .wma) peut accueillir en son sein des donnes mdia encodes par diffrents codecs (en l'occurrence diffrentes versions du codec audio de Microsoft). En d'autres termes, la connaissance du format d'un fichier ne suffit pas toujours dterminer comment les donnes mdia ont t encodes. Toutefois, lorsque c'est le cas, on a tendance confondre format et codec...

c.

Compression de mdia vs. compression de fichiers textes

Les codecs bureautiques classiques (zip, bz2, 7z, ...) recherchent des redondances de caractres pour allger l'encodage des textes. Ils sont notoirement inefficaces pour compresser les mdia audio et vido.

d.

Codecs et formats sans pertes

Pour une analyse dtaille des diffrents codecs audio sans pertes , c'est--dire partir desquels on peut reconstituer octet par octet le fichier audio initialement numris, voire aussi la page Lossless comparaison 51.

I.

WAV (FORMAT OUVERT)

Wav (.wav) est le format standard pour l'audio numris mais non compress, en utilisant le codec de base PCM52. Les CD Audio stockent leurs donnes dans un format proche du WAV. Les logiciels d'dition sonore ncessitent galement que les sons soient dans ce format pour pouvoir les diter. Des logiciels comme Audacity permettent tout de mme d'importer des fichiers mp3 qu'ils reconvertissent d'abord en .Wav (Source53). Attention, les fichiers Wav sont limits 2 Gio, ce qui peut tre limitant dans certains cas. Codage/dcodage dans Audacity notamment.

48 49 50 51 52 53

http://www.digitalfaq.com/guides/video/introduction-restore-audio.htm (visitle18/8/2010) http://www.tested.com/news/how-to-rip-and-clean-your-analog-audio-collection/460/ (visitle18/8/2010) http://www.digitalpreservation.gov/formats/fdd/sound_fdd.shtml (visit le 19/07/2007) http://wiki.hydrogenaudio.org/index.php?title=Lossless_comparison (visit le 19/07/2007) http://fr.wikipedia.org/wiki/Modulation_d%27impulsion_cod%C3%A9e (visit le 29/08/2009) http://fr.wikipedia.org/wiki/WAVEform_audio_format (visit le 7/09/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 25/84

II.

BROADCAST WAVE FORMAT (BWF)

C'est une extension du format WAV, permettant l'ajout de mtadonnes internes au fichier. Les fichiers BWF ont une extension WAV et sont lus par les logiciels lisant habituellement le WAV. Cf la page BWF 54 de Wikipedia pour plus d'info.

III.

MPEG-4 AUDIO LOSSLESS CODING (ALS) MPEG

La compression sans pertes est le dveloppement le plus rcent du standard audio MPEG-4, destine aux signaux audio en haute dfinition. La technologie de base a t dveloppe par le NUe Group (Fachgebiet Nachrichtenbertragung) l'universit technique de Berlin. La norme ISO du MPEG-4 ALS est ISO/IEC 144963:2005/Amd 2:2006.55 Ce format n'est pas encore rpandu du fait du manque (depuis 2006) d'encodeurs et de dcodeurs.

IV.

APPLE AAC LOSSLESS (CODEC ET FORMAT PROPRITAIRES)

Apple Lossless Audio Codec (ALAC) est un codec d'encodage sans perte (lossless) apparu en 2004. Il a t dvelopp par Apple pour combler une lacune de la norme MPEG-4, dont la partie consacre l'encodage sans perte tardait alors tre finalise. ALAC est un codec propritaire et qui s'adresse majoritairement aux utilisateurs d'iTunes et des iPod. l'instar de tous les codecs sans perte, ALAC permet de compresser sans aucune dgradation des fichiers musicaux au format PCM un taux de compression voisin de 40 50% (les ratios mesurs peuvent cependant grandement varier en fonction principalement du volume de la piste : plus le volume est fort (pour la pop music par exemple), plus le ratio est mauvais, l'inverse du classique. En regard des codecs concurrents, ALAC prsente une efficacit moindre. Cette contre-performance est toutefois partiellement dlibre, puisque le codec a t essentiellement dvelopp en vue de produire des fichiers capables d'tre dcods par des appareils bien moins puissants et autonomes que les ordinateurs de bureau (pour l'ipod en particulier). Une meilleure compression suppose en effet une complexit accrue, complexit ayant pour consquence de rduire l'autonomie des appareils nomades. Ainsi, les quelques pourcentages perdus en terme de ratio de compression sont compenss par une implmentation matrielle facilite. Nanmoins, ALAC reste actuellement infrieur aux autres codecs sans perte de faible complexit. FLAC prsente ainsi une rapidit suprieure pour un taux de compression quasiidentique, alors que WavPack bnficie de performances en tous points (ratio de compression, vitesse d'encodage et de dcodage) suprieures. Codage/Dcodage : iTunes, QuickTime (Source56).

V.

FLAC CODECETFORMATOUVERT) (

Free Lossless Audio Codec (FLAC) est un codec libre de compression audio sans perte. Un enregistrement numrique (tel qu'un CD) cod en FLAC peut tre dcompress pour obtenir une copie identique octet par octet celle de l'enregistrement numrique initial. Les sources audio peuvent tre codes en FLAC pour permettre une rduction de taille de 30 70 %. La rduction de taille dpend de la source : plus le signal est constitu d'ondes rgulires (sons naturels), meilleure est la compression. Par contre, un signal alatoire (bruit) ne se compresse pas trs bien. Ce phnomne se constate pour tous les codecs de compression sans perte. FLAC est appropri pour tous les archivages de donnes audio, avec le support des mtadonnes, de l'image de couverture, ainsi que pour la recherche rapide. FLAC est libre et open source ; ne ncessitant pas le paiement de redevances, il est bien support par de nombreux logiciels.57 Codage/dcodage par de nombreux outils gratuits ou OpenSource dont Audacity, lecture par VLC.

54 55 56 57

http://en.wikipedia.org/wiki/Broadcast_Wave_Format visit le mardi 6 septembre 2011 http://en.wikipedia.org/wiki/MPEG-4_ALS (visit le 29/08/2009) http://fr.wikipedia.org/wiki/Apple_Lossless (visit le 19/07/2007) http://fr.wikipedia.org/wiki/Free_Lossless_Audio_Codec (visit le 7/09/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 26/84

e.

Codecs et formats avec pertes

Pour compresser plus fortement les fichiers audio, on utilise les limitations de l'oreille humaine qui ne peroit pas certaines donnes audio58 et on code de faon compacte des donnes rptitives.

I.

MP3 FORMATETCODECPROPRITAIRES) (

Le MPEG-1/2 Audio Layer 3, plus connu sous son abrviation de MP3, est la spcification sonore du standard MPEG-1, du Moving Picture Experts Group (MPEG). C'est un codec capable de rduire drastiquement la quantit de donnes ncessaire pour restituer de l'audio, mais qui, pour l'auditeur, ressemble une reproduction du son original non compress, c'est--dire avec perte de qualit sonore significative mais acceptable pour l'oreille humaine. L'extension de nom de fichier est .mp3 et le type MIME est audio/mpeg[1]. Ce type de fichier est appel fichier MP3 . Le codage MPEG-1/2 Layer 2 est n avec le projet Digital Audio Broadcasting (radio numrique DAB) qui fut lanc par le Deutsche Luft und Raumfahrt. Ce projet a t financ par l'Union europenne, et faisait partie du programme de recherche EUREKA. Ce format populaire de compression audio permet une compression allant de 1/4 1/12. Un fichier audio occupe ainsi quatre douze fois moins d'espace une fois compress au format MP3. Le taux de compression peut tre augment en choisissant un dbit binaire (en anglais bitrate) plus faible. On considre en gnral qu'il faut au moins 128 ou 192 kilobits par seconde (kbit/s) pour bnficier d'une qualit audio acceptable pour un morceau de musique. 8 kbit/s, le son est fortement altr (bruits parasites non attendus, spectre sourd , ). Ce codec utilise un systme de compression partiellement destructif. Il ne stocke pas intgralement le spectre des frquences audio. Il tente d'annuler d'abord les sons les moins perus de faon ce que les dgradations se fassent le moins remarquer possible. Ce n'est pas une compression proprement parler, mais plutt une suppression d'informations. La compression au format MP3 exploite un modle psycho-acoustique de l'effet dit de masque : si deux frquences d'intensits diffrentes sont prsentes en mme temps, l'une peut tre moins perue que l'autre selon que ces deux frquences sont proches ou non. La modlisation de notre audition selon ce principe est au dpart empirique, mais assez efficace. Toutefois, si le taux de compression est trop important, on peut tre amen faire ressortir certaines harmoniques inattendues. Cela donne alors l'impression de bruits parasites et dsagrables au milieu du son. On peut amliorer la qualit dbit moyen gal en utilisant un dbit binaire variable (VBR ou Variable Bit Rate par opposition un dbit constant Constant bit rate, CBR). Dans ce cas, les passages peu complexes, comme les silences seront cods avec un dbit d'information plus faible (avec moins d'octets ). On peut ainsi coder 64 kbit/s au lieu de 128, rduisant ainsi la taille totale du fichier tout en gardant une trs bonne qualit lors des passages riches en harmoniques. L'amlioration apporte est variable selon le morceau cod. L'encodage en VBR peut nanmoins poser des problmes de compatibilit avec certains lecteurs.59 La popularit du format MP3 ne se dment pas, mme compte tenu de son obsolescence technique. L'un des plus importants magasins de vente de musique en ligne, Amazon, utilise encore ce format. Codage/dcodage avec le codec LameEncoder, encoder MP3 Open Source, qui produit, de l'avis gnral, la meilleure compression. LameEncoder est intgrable Audacity.

58 http://en.wikipedia.org/wiki/Psychoacoustics (visit le 19/07/2007) 59 http://fr.wikipedia.org/wiki/Mp3 (visit le 7/09/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 27/84

II.

REALAUDIO FORMATETCODECPROPRITAIRES) (

RealAudio (.ra)60 est un format de stream (de diffusion en continu) souvent utilis par les radios qui diffusent sur internet. A qualit quivalente, les fichiers en RealAudio sont plus petits qu'encods en MP3 mais de moins bonne qualit si le dbit est faible. Codage/dcodage : RealProducer61, dcodage simple avec le lecteur RealPlayer.

III.

OGGETVORBIS(FORMATETCODECOUVERTS)

Ogg (prononcer augue ) est le nom du principal projet de la fondation Xiph.Org dont le but est de proposer la communaut des formats et codecs multimdias ouverts, libres et dgags de tout brevet. Cest aussi le nom du format de fichier conteneur propos par ce mme projet. Lextension .ogg est une des extensions possibles pour les fichiers au format Ogg. Par abus de langage, on appelle couramment fichier Ogg un fichier audio au format Ogg contenant des donnes audio compresses en Vorbis, lun des codecs du projet Ogg. La fondation Xiph.Org a pourtant cr un ensemble d'extensions pour les diffrents types de contenus : .oga pour les fichiers audio uniquement, .ogv pour la vido (gnralement encode avec Theora)62 codage/dcodage : Audacity ; lecture : vlc.

IV.

MP3PRO FORMATETCODECPROPRITAIRES) (

La compression mp3Pro63 se prsente comme un successeur avantageux au mp3. En effet, les fichiers gnrs par un encodeur mp3PRO sont compatibles avec tous les lecteurs mp3. Cependant seuls les lecteurs certifis mp3PRO bnficient des avantages supplmentaires de cet encodage. L'encodage mp3Pro prsente trois particularits qui en font un systme de compression offrant de meilleurs rsultats sonores que ceux d'un simple mp3 standard : L'utilisation du VBR (pour Variable Bit Rating) qui adapte en temps rel le dbit en fonction de la densit et de la complexit sonore ; La prservation de la bande passante aigu normalement sacrifie par le mp3 standard ; Une qualit sonore quivalente au 320 kbit/s du layer III en VBR (qui varie entre 64 kbit/s et 128 kbit/s) si bien qu' qualit gale un fichier mp3Pro permet un gain de place substantiel par rapport un fichier mp3 standard (entre 25% et 50% de gain).

Le Codec mp3PRO est propritaire. Nanmoins un lecteur MP3 standard saura lire un mp3PRO, avec une qualit moindre. Trs peu de logiciels prennent en compte le mp3PRO et seuls les baladeurs de marque Thomson et ses filiales savent en tirer pleinement profit. Codage/dcodage : Thomsom Encoder64, ou Audion pour Mac65.

V.

AAC FORMATOUVERT) (

AAC - Advanced Audio Coding - L'Advanced Audio Coding ou AAC est un algorithme de compression audio avec perte de donnes ayant pour but d'offrir un meilleur ratio qualit/compression que le format plus ancien MPEG-1/2 Layer 3 (plus connu sous le nom de MP3). Utilis dans iTunes, iPod et largement rpandu grce au succs de l'Itunes Store. Peut-tre utilis avec des DRM. Il est dfini dans la partie 3 de la norme MPEG4 . Les amliorations apportes par l'AAC touchent notamment : 60 61 62 63 64 65

les frquences d'chantillonnage : de 8 kHz 96 kHz (MP3 officiel : 16 48 kHz) ; le nombre de canaux : jusqu' 48 ; une meilleure gestion des frquences au-del de 16 kHz ; Ces avances techniques devant apporter l'auditeur un message audio d'une qualit et d'une stabilit accrue par rapport au MP3 frquence d'chantillonnage quivalente ou infrieure.

http://en.wikipedia.org/wiki/Realaudio (visit le 19/07/2007) http://www.realnetworks.com/products/producer/index.html (visit le 19/07/2007) http://fr.wikipedia.org/wiki/Ogg (visit le 7/09/2009) http://fr.wikipedia.org/wiki/Mp3PRO (visit le 7/09/2009) http://www.mp3prozone.com/download.htm (visit le 19/07/2007) http://www.panic.com/audion (visit le 9/10/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 28/84

L'AAC adopte une approche modulaire du codage : en fonction de la complexit du flux coder, de la qualit vise et de la taille du fichier que l'on souhaite obtenir. L'utilisateur peut crer des profils afin de dfinir l'outil qu'il souhaite utiliser parmi le jeu de rglages prdfinis. l'intgration de systmes de DRM.

L'extension de fichier gnralement adopte est .mp4 (pour MPEG-4), .m4a (pour MPEG-4 audio) ou .m4p (pour MPEG-4 protg). Codage/dcodage : iTunes, QuickTime, VLC pour le dcodage des fichiers sans DRM.

VI.

WINDOWS MEDIA AUDIO FORMATETCODECPROPRITAIRES) (

Windows Media Audio66 aussi appel WMA est un format propritaire de compression audio de type lossy (destructeur) dvelopp par Microsoft. Le format WMA offre pour spcificit la possibilit de protger ds l'encodage les fichiers de sortie contre la copie illgale par une technique de gestion des droits numriques (DRM en anglais). Le format existe sous deux formes : le WMA Standard, le premier tre sorti, le plus rpandu sur Internet et le seul tre lisible (actuellement) sur de nombreux baladeurs numriques le WMA Pro, thoriquement de meilleure qualit mais bien moins rpandu.

Les deux sont capables de coder en dbit constant (CBR) ou en dbit variable (VBR). Le codec wma est parmi tous les formats d'encodage avec pertes disponibles l'un des plus rapides.

f.

Cas du MIDI

Le Musical Instrument Digital Interface ou MIDI est parfois confondu avec les formats dcrits ci-dessus. C'est un protocole de communication et de commande permettant l'change de donnes entre instruments de musique lectronique, un ou plusieurs de ces instruments pouvant tre des ordinateurs. Il permet de prciser le type d'instrument, la note, la dure, etc... Les fichiers MIDI sont reproduits sur ordinateurs ou sur instruments MIDI l'aide de sons pr-numriss ou synthtiss. En ce sens, les fichiers MIDI sont l'quivalent des formats vectoriels pour les images. Ils prennent en gnral trs peu de place puisque ne sont codes que des descriptions textuelles des sons reproduire.

g.

Le(les) formats choisir pour l'archivage

Les formats privilgier pour un archivage des sons (on parle de fichiers master ou matres partir desquels seront drivs les fichiers de diffusion) sont ceux qui contiennent toute l'information numrise, et qui sont donc de la qualit maximale possible. On choisira prfrentiellement le format Wav (aucune compression) ou FLAC (compression sans pertes).

h.

Les formats choisir pour la diffusion

Pour la diffusion, on peut choisir un format avec pertes (MP3, MP4 ou OGG), dont les paramtres seront soigneusement choisis pour minimiser la perte d'information et, suivant les besoins, stream. viter les formats propritaires tels que WMA. On voit apparatre de nouvelles faons de diffuser, en intgrant le son dans un fichier flash. L'avantage est l'absence de plugins supplmentaires ncessaires la lecture (Flash tant extrmement rpandu) et une certaine barrire la rcupration du fichier son en tant que fichier indpendant. Cette protection est cependant bien facilement contournable. L'anne 2005/2006 a aussi t marque par le dveloppement du podcast qui combine une diffusion de fichiers MP3 ou MP4 un abonnement RSS. Cf Best Practice Guidelines for Digital Collections at the UM Libraries67 appendice VIII pour des exemples de bonnes pratiques. Cf Appendix IV: A Typology of Formats pour des guides de rfrence sur les formats audio.

i.

Paramtres de numrisation et de compression

Les paramtres de numrisation et de compression s'expriment d'une faon lgrement diffrente de ce qui a t prsent jusqu' prsent. On utilise l'chantillonnage d'une part, exprim en Hz, et le dbit, exprim en kbps. En dehors de contraintes spcifiques lies aux technologies de diffusion (tlphone, bande FM, )66 http://en.wikipedia.org/wiki/Windows_Media_Audio (visit le 19/07/2007) 67 http://www.lib.umd.edu/dcr/publications/best_practice.pdf (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 29/84

l'chantillonnage n'est pas une valeur qu'on peut modifier loisir cause du thorme de Shannon. Il est le plus souvent fix 44,1 kHz ou 48 kHz. Par contre, le vritable paramtre sur lequel on peut ajuster la qualit de compression est le dbit (outre le CODEC de compression videmment). Petit rappel de robinets qui remplissent des baignoires qui fuient (!) : Un dbit de 1 kbps = 1000 bits par seconde. Un fichier audio ayant un dbit de 1 kbps et durant 3 minutes aura donc une taille de : 3*180*1000/8 = 67500 octets soit 67,5 Ko. Un fichier de 3 minutes numris et compress au dbit constant (ou moyen) de 320 kbps aura la taille suivante : 3*60*320000/8 = 7,2 Mo Prenons l'exemple d'une compression en mp3 en utilisant Audacity avec le plugin LameEncoder. Le flux bitrate est ici choisi en mode moyenne (ABR : Average Bitrate) ce qui permet au compresseur de dpenser plus d'information dans les passages sonores qui le ncessitent tout en assurant une taille moyenne prdictible. Voici quelques uns des paramtres qu'on peut conseiller pour la diffusion : rglage tlphone : 16kbps/mono voix : 56kbps/mono fm/tape : 112kbps hifi : 160kbps cd : 192kbps studio : 256kbps

j.

Exemples de paramtres d'un fichier audio rel

* * * MediaInfo Mac 0.7.33.4 file analysis report. Report for file: 0001-version_brute.mp3 General / Container Stream #1 Total Audio Streams for this File.................1 Audio Codecs Used.................................MPEG-1 Audio layer 3 File Format.......................................MPEG Audio Play Time.........................................3mn 12s Total File Size...................................2.94 MiB Total Stream BitRate..............................128 Kbps Audio Stream #1 Codec.............................................MPEG Audio Audio Stream Length...............................3mn 12s 390ms Audio Stream BitRate..............................128 Kbps Audio Stream BitRate Mode.........................CBR Number of Audio Channels..........................1 Sampling Rate.....................................44.1 KHz Audio Stream Delay................................187ms Audio Stream Size.................................2.94 MiB (100%)

Pour info, la meilleure qualit en MP3 s'obtient en choisissant un mode constant bitrate et un flux de 320kbps, en chantillonnant la frquence maximale (48kHz). Faut-il encore que le son analogique et numris soient de grande qualit, sinon, c'est inutile. Un contrle auditif est toujours conseill (attention la qualit du matriel de reproduction et aux conditions environnementales).

k.

Restitution du son

Comme indiqu ci-avant, la restitution d'un son ncessite son codage inverse en analogique l'aide d'un processeur ou d'un processus CNA (Convertisseur Numrique Analogique). Si le format n'est pas un format directement exploitable il faut d'abord ramener le son un format WAV puis le convertir en analogique.

l.

En savoir plus sur les formats...

C'est le document le plus complet que j'ai trouv ! Le Guide Mthodologique pour le choix de formats numriques prennes dans un contexte de donnes orales et visuelles du projet TGE-Adonis68.

7.

tude de cas : le Cornell Lab of Ornithology

68 http://www.tge-adonis.fr/sites/default/files/ressourcesdoc/guide_formats_numeriques-05.pdf, visit le mardi 6 septembre 2011

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 30/84

a.

Introduction

Ce qui suit est la traduction partielle et grands traits de l'article Digitizing the Worlds Largest Collection of Natural Sounds : Key Factors to Consider when Transferring Analog-Based Audio Materials to Digital Formats 69 de la revue RLG DigiNews (fvrier 2004). Il est fortement recommand de le lire en intgralit ! Projet de la Macauly Library70 : Concerne : the Macaulay Library of Natural Sounds (MLNS)[1] at Cornell University, 160 000 enregistrements d'oiseaux, d'insectes, de grenouilles, et de cris de mammifres. Formats analogiques : disques actates, cassettes, bandes, dans des tats de conservation trs varis (certaines bandes ont ncessit un traitement spcifique avant exploitation). 6 studios de numrisation compltement quips

b.I.

Etapes cruciales de ce projetLES MDIA ET FORMATS ANALOGIQUESExamen des bandes, et traitement prventif pour temporairement les "stabiliser" par une cuisson 50C pendant 24 heures. Certaines avaient leurs axes briss, d'autres avaient des traces d'adhsifs. Examen du format d'enregistrement de chaque bande, rendu ais par des "mtadonnes" compltes sur l'enregistrement et le modle de magntophone utilis pour les produire. Pour les cas litigieux, utilisation d'un "dveloppeur magntique" permettant de visualiser l'enregistrement magntique et de dterminer quelles ttes choisir. Utilisation d'un magntophone haut de gamme (Studer A-820) dont la propret et la tension de la bande ont t rgulirement vrifis. Lecture en vitesse lente pour tenir compte des bandes fragiles Calibration des ttes de lecture en utilisant des normes internationales : alignement des ttes (hauteur, azimuth, ...), qualisation de la lecture, niveaux de lecture, vitesse, ...

Concernant les cassettes audio, lecture par un magntophone professionnel Nakamichi CR-7A calibr et mis en marche avec le mme soin Les calibrations et alignements des ttes furent accomplies l'aide de tests informatiss de la socit Audio Precision, spcialise dans toutes les mesures audio. Les rsultats des tests initiaux furent rgulirement compars aux tests raliss en cours de numrisation pour suivre l'volution des performances des lecteurs. Ceci permit de dceler les problmes avant qu'ils aient des incidences sur le processus de numrisation luimme.

II.

LA CONVERSION ANALOGIQUE/ NUMRIQUE

Le convertisseur fut l'objet d'une attention toute particulire. Cet lment est l'un des maillons primordiaux de la chane de numrisation et son mauvais fonctionnement pouvait dtruire tous les efforts effectus par ailleurs. Dans le cas prsent, les sons sont d'excellente qualit, couvrant un large spectre. Les objectifs taient ici de raliser une numrisation d'une qualit sans compromis. Les tests raliss sur 6 matriels aux caractristiques techniques apparemment proches ont donn des rsultats trs diffrents. Le choix s'est finalement port sur le Prism Dream AD-2, le seul dispositif ne pas "colorer" les signaux. Qu'est-ce qui constitue un bon convertisseur analogique/numrique ? : capacit prendre en compte l'intgralit du spectre sonore numriser : de 4 32 kHz, chantillonn 96 kHz capacit rendre la dynamique : quantification sur 24 bits (128 dB rendus)

(cf les autres caractristiques dans l'article original)

69 http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070519/viewer/file3226.html (visit le 7/09/2009) 70 http://www.animalbehaviorarchive.org/loginPublic.do (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 31/84

Ces spcifications ne sont pas facilement rencontres dans les cartes sons prsentes dans les ordinateurs, ni dans les enregistreurs de CD-AUDIO grand public. Les quipements doivent de plus : avoir un courant lectrique trs pur, tre fixs au sol pour viter toute vibration tre pilots par des horloges ultra prcises utiliser des composants lectroniques de trs grande qualit faible tolrance, un design de carte lectronique de trs grande qualit.

Tout ceci un prix, mais cela en valait la peine pour ce projet Un autre lment cl du processus fut la dtermination du niveau de signal de transfert : utilisation d'un pramplificateur Benchmark Media trs faible bruit, et faible distorsion entre le lecteur analogique et le convertisseur A/N. Ses vue-mtres ont t trs utiles pour dterminer le bon niveau d'entre sur le convertisseur A/N (pas assez = perte de dynamique, trop fort : saturation du signal). En complment de la surveillance du signal par vue-mtres, un second dispositif de surveillance a t mis en place utilisant l'oreille humaine. Il a fallu pour cela employer un convertisseur inverse (numrique => analogique) et des hauts-parleurs de contrle. Un dispositif permettait l'oprateur de passer facilement de la lecture analogique