28
SCI6005 Information numérique et informatique documentaire (A2020) Cours 5 : Environnements en réseau - Internet et Web Christine Dufour, EBSI, UdeM 29 septembre 2020 Paternité - Pas d'Utilisation Commerciale - Pas de Modification : http://creativecommons.org/licenses/by-nc-nd/4.0/fr/

SCI6005 Information numérique et informatique documentaire

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SCI6005 Information numérique et informatique documentaire

SCI6005 Information numeacuterique et informatique documentaire (A2020)

Cours 5 Environnements en reacuteseau - Internet et WebChristine Dufour EBSI UdeM29 septembre 2020

Paterniteacute - Pas dUtilisation Commerciale - Pas de Modification httpcreativecommonsorglicensesby-nc-nd40fr

I - Cours 5 - Environnements en reacuteseau Internet et Web 3

1 + Au programme aujourdhui 3

2 + Alignement peacutedagogique 3

3 Introduction 4

4 Eacutevolution dInternet et du Web 4

41 Internet 5

42 Web 6

5 Donneacutees sur le Web 15

51 Donneacutees ouvertes 15

52 Donneacutees lieacutees 16

53 Donneacutees de recherche 17

6 Importance de la normalisation 18

7 Ressources en lien avec le cours 20

Glossaire 21

Bibliographie 24

Webographie 26

Index 27

Creacutedits des ressources 28

Table des matiegraveres

3 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbull

1 + Au programme aujourdhui

Eacutevolution du Web et dInternetTypes de donneacutees sur le WebImportance de la normalisation

2 + Alignement peacutedagogique

Objectifs viseacutes mateacuteriel du cours et eacutevaluation Examen mi-session

Lien entre les objectifs les compeacutetences agrave deacutevelopper et le mateacuteriel du cours 5

Objectif geacuteneacuteral Comprendre la place des technologies et de linformation numeacuterique en contexte documentaire

Objectifs speacutecifiques Compeacutetences agrave deacutevelopper Mateacuteriel associeacute

Expliquer les concepts fondamentaux des environnements en reacuteseau

Deacutefinir ce quest Internet le Web 10 le Web 20 et le Web 30

Section Eacutevolution dInternet et du Web

Donner des exemples de plateformes 20 Section Eacutevolution dInternet et du Web gt Historique du Web et dInternet gt Web gt Web 20 Le Web participatif

Expliquer les enjeux lieacutes agrave leacutevolution du Web Section Eacutevolution dInternet et du Web gt Culture informationnelle et numeacuterique sur le Web

Expliquer ce que sont les donneacutees ouvertes les donneacutees lieacutees et les donneacutees de recherche

Section Donneacutees sur le Web

TP Donneacutees

Donner des raisons justifiant limportance de la normalisation

Section Importance de la normalisation

Cours 5 - Environnements en reacuteseau Internet et Web

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 4

Objectifs viseacutes matiegravere du cours et activiteacutes associeacutees

Lien entre les objectifs la matiegravere du cours 5 et les activiteacutes associeacutees

Objectif geacuteneacuteral Comprendre la place des technologies et de linformation numeacuterique en contexte documentaire

Objectifs speacutecifiques Matiegravere Activiteacutes

Expliquer les concepts fondamentaux des environnements en reacuteseau

Donneacutees ouvertes TP Donneacutees

Donneacutees lieacutees TP Donneacutees

Donneacutees de recherche TP Donneacutees

3 Introduction

Afin de bien vivre dans lenvironnement reacuteseauteacute omnipreacutesent dans le quotidien des professionnelles et professionnels de linformation en sus des concepts de bases des environnements reacuteseauteacutes il est important de comprendre un des reacuteseaux que lon croise au quotidien soit le Web Les milieux documentaires ont inteacutegreacute le Web comme plateforme pour

leurs ressources et leurs services avec les deacutefis qui en deacutecoulent soulignent en effet que ces Lankes et al (2007)

derniers sont multiples entre autres pour linteacutegration du Web 20 au sein de leurs systegravemes dinformation tant sur le plan politique et eacutethique quopeacuterationnel et technique Une attention particuliegravere doit ecirctre porteacutee agrave chacune des composantes de l organisation 20 (acteurs infrastructures etc) et agrave son insertion dans son environnement informationnel (

)Dufour amp Cadieux 2013

Apregraves avoir preacuteciseacute les bases de leacutevolution du Web nous nous inteacuteresserons agrave la culture numeacuterique qui en deacutecoule Nous enchaicircnerons par la suite sur les principaux types de donneacutees quon y retrouve ainsi que sur limportance de la normalisation dans ces environnements reacuteseauteacutes

4 Eacutevolution dInternet et du Web

Dans sa conceptualisation lhistoire de lInternet et du Web remonte aux anneacutees 40 lorsque Vannevar Bush a recircveacute dun univers de documents interconnecteacutes en reacuteaction agrave lexplosion documentaire quil observait Bien quil nait pas lui-mecircme inventeacute le terme hypertexte cest une des premiegraveres instances de ce concept Dans sa concreacutetisation technique cest dans les anneacutees 60 que le premier nœud de ce qui deviendra Internet a eacuteteacute mis en place par leacutequipe de Tim Berners Lee

5 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Quelques dates importantes dans lhistoire dInternet et du Web

On remarque que le deacutelai entre les moments cleacutes se raccourcit plus le temps avance En fait cette observation peut se faire plus globalement lorsque lon observe ladoption des technologies Ceci est eacutevident si on compare le temps pris pour atteindre 50 millions dauditeurs pour certaines technologies marquantes dans notre histoire la radio a pris 38 ans la teacuteleacutevision 13 ans Internet 4 ans le iPod 3 ans et Facebook 2 ans ( Did you know 30 2012 source httpwwwyoutube

il est agrave noter que dautres sources donnent des chiffres un peu diffeacuterents par exemple comwatchv=YmwwrGV_aiE mais une tendance similaire est observable)httpstwittercomGuglielminettistatus919245063967911937

Si le rythme est essoufflant pour lutilisateur qui veut rester agrave jour il lest encore plus pour les organisations dont les activiteacutes sont eacutetroitement lieacutees avec ces environnements numeacuteriques Cela leur demande decirctre de plus en plus agiles dans leur inteacutegration des technologies et de shabituer aux changements perpeacutetuels ce qui nest pas toujours facile dun point de vue humain et organisationnel

Lhistoire dInternet et du Web est jalonneacutee de moments cleacutes qui seront deacutecrits dans les sections qui suivent

41 Internet

Dentreacutee de jeu il est important de bien comprendre que les termes et ne sont pas synonymes On retrouve Internet Webparfois une certaine confusion entre les deux termes Plus preacuteciseacutement on peut deacutefinir Internet ainsi

A huge computer network available to everyone with a personal computer and a means to connect to it It is the actual physical network made up of wires cables and satellites as opposed to the web which is the multimedia interface to resources available on the Internet

(Source 2019 p 367)OLeary et al

Le Web est ainsi une des sphegraveres dInternet Internet eacutetant un reacuteseau plus large regroupant diffeacuterentes sphegraveres (Web courriel FTP etc)

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 6

bullbullbullbull

bullbullbull

Internet est neacute dune initiative militaire ameacutericaine Le premier nœud du reacuteseau ARPANET (Advanced Research Project ) agrave lorigine dInternet a eacuteteacute mis en place en 1969 Avant lapparition du Web les eacutechanges sur Internet Agency Network

eacutetaient uniquement textuels preacutecisent quune des cleacutes du deacuteveloppement rapide dInternet est le fait Leiner et al (1997)

que la documentation et plus particuliegraverement les speacutecifications et les protocoles eacutetait accessible gratuitement et librement

42 Web

Comme preacuteciseacute dans la section preacuteceacutedente le Web est une interface graphique agrave des contenus sur Internet

Prior to the introduction of the web in 1992 the Internet was all text The web made it possible to provide a multimedia interface that includes graphics animations sound and video

(Source 2019 p 377)OLeary et al

Au cœur du Web se retrouve lideacutee des documents interconnecteacutes proposeacutes en 1945 par Vannevar Bush Dans son texte

il propose lideacutee dune machine nommeacutee MEMEX pour reacutesoudre les problegravemes lieacutes agrave lexplosion As We May Think

documentaire Cette derniegravere serait en effet en mesure de ranger et rendre accessible tous les documents en permettant

La visualisation des documents sur microfilm sur un eacutecran documents pouvant ecirctre compleacuteteacutes par des imagesLa localisation des documentsLinclusion de pistes associatives entre les documents

Le neacuteologisme hypertexte a eacuteteacute proposeacute par le philosophe et sociologue ameacutericain Theodore Nelson en 1965 Il est agrave lorigine du projet Xanadu dont lobjectif eacutetait de regrouper tous les documents de lhumaniteacute Ce systegraveme accessible agrave tous permettrait lajout de documents et la deacutefinition de liens entre ces derniers Au deacutepart il sagissait uniquement dune conceptualisation sans impleacutementation Depuis des deacutemonstrations ont vu le jour apregraves bien des anneacutees dont

en OpenXanadu 2014

Le premier logiciel hypertexte grand public creacuteeacute par Bill Atkinson est HyperCard (Apple) en 1987 logiciel dont le deacuteveloppement sest termineacute en 1998 Il permettait de preacutesenter des contenus multimeacutedias sur des fiches virtuelles cartonneacutees cartes qui pouvaient ecirctre lieacutees entre elles par des boutons Pour les curieux et les curieuses (ou les nostalgiques) Internet Archive a mis en ligne en 2017 pour fecircter les 30 ans dHyperCard une collection de projets

HyperCard

Finalement lapplication la plus connue du modegravele hypertextuel le Web a eacuteteacute creacuteeacutee au CERN par leacutequipe de Tim Berners-Lee en 1989 Il sagit dune version alleacutegeacutee des visions initialement proposeacutees pour lhypertexte entre autres par T Nelson et V Bush

Absence de gestion des droits dauteurLiens unidirectionnels se cassant lorsque la ressource disparaicirctAbsence daperccedilu des ressources lieacuteesAbsence de systegraveme dannotation et de gestion de versions

7 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Le Web est passeacute par diffeacuterentes phases (Web 10 Web 20 et Web 30) qui seront deacutecrites dans les sections subseacutequentes

421 Web 10 Les premiegraveres anneacutees statiques du Web

La premiegravere version du Web le Web 10 en quelque sorte que certains deacutesignent comme un Web de documents correspond agrave un Web ougrave un petit nombre dinternautes eacutetaient des creacuteateurs de contenus cette creacuteation demandant en effet des compeacutetences informatiques plus avanceacutees La majoriteacute des internautes eacutetait ainsi des observateurs pouvant chercher parmi les informations existantes et les consulter Maignien (2014) le compare agrave une bibliothegraveque distribueacutee sans murs

Le modegravele documentaire est alors clairement celui dune bibliothegraveque distribueacutee sans murs autrement appeleacutee bibliothegraveque virtuelle ou numeacuterique mais ougrave linformation nest pas classeacutee de faccedilon hieacuterarchiseacutee dans un arbre mais distribueacutee en graphe (il existe autant de relations non hieacuterarchiseacutees que de liaisons possibles entre les documents ou des parties de ces documents)

(Source p 78)Maignien 2014

422 Web 20 Le Web participatif

La geacuteneacuteration suivante le Web 20 est un pheacutenomegravene agrave la fois technologique et social ce que fait bien ressortir cette deacutefinition

Web doteacute doutils et de contenus interactifs qui permettent aux internautes de participer agrave la creacuteation de contenus Web de partager de linformation en ligne et de communiquer entre eux

(Source Grand dictionnaire terminologique 2018 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26519897

Les mots-cleacutes ici sont participer creacuteation de contenus et partager Certains services et certaines technologies phares sont associeacutes au Web 20

Principaux services et technologies phares du Web 20

ServicesTechnologies Deacutefinition Exemples

Blogues Site Web ou section de site Web geacuteneacuteralement tenus par une seule personne consacreacutes agrave une chronique personnelle ou agrave une theacutematique particuliegravere preacutesenteacutees sous forme de billets ou darticles (OQLF 2018 httpgdtoqlfgouvqccaficheOqlfaspx

)Id_Fiche=8370242

Bibliomancienne

Archives 21

Microblogues Blogue permettant de communiquer en temps reacuteel au moyen de messages courts de 140 agrave 240 caractegraveres le plus souvent par lintermeacutediaire dune plateforme de microblogage afin de partager de linformation avec une communauteacute dinternautes (OQLF 2018

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26502311

Bruno Guglielminetti

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 2: SCI6005 Information numérique et informatique documentaire

I - Cours 5 - Environnements en reacuteseau Internet et Web 3

1 + Au programme aujourdhui 3

2 + Alignement peacutedagogique 3

3 Introduction 4

4 Eacutevolution dInternet et du Web 4

41 Internet 5

42 Web 6

5 Donneacutees sur le Web 15

51 Donneacutees ouvertes 15

52 Donneacutees lieacutees 16

53 Donneacutees de recherche 17

6 Importance de la normalisation 18

7 Ressources en lien avec le cours 20

Glossaire 21

Bibliographie 24

Webographie 26

Index 27

Creacutedits des ressources 28

Table des matiegraveres

3 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbull

1 + Au programme aujourdhui

Eacutevolution du Web et dInternetTypes de donneacutees sur le WebImportance de la normalisation

2 + Alignement peacutedagogique

Objectifs viseacutes mateacuteriel du cours et eacutevaluation Examen mi-session

Lien entre les objectifs les compeacutetences agrave deacutevelopper et le mateacuteriel du cours 5

Objectif geacuteneacuteral Comprendre la place des technologies et de linformation numeacuterique en contexte documentaire

Objectifs speacutecifiques Compeacutetences agrave deacutevelopper Mateacuteriel associeacute

Expliquer les concepts fondamentaux des environnements en reacuteseau

Deacutefinir ce quest Internet le Web 10 le Web 20 et le Web 30

Section Eacutevolution dInternet et du Web

Donner des exemples de plateformes 20 Section Eacutevolution dInternet et du Web gt Historique du Web et dInternet gt Web gt Web 20 Le Web participatif

Expliquer les enjeux lieacutes agrave leacutevolution du Web Section Eacutevolution dInternet et du Web gt Culture informationnelle et numeacuterique sur le Web

Expliquer ce que sont les donneacutees ouvertes les donneacutees lieacutees et les donneacutees de recherche

Section Donneacutees sur le Web

TP Donneacutees

Donner des raisons justifiant limportance de la normalisation

Section Importance de la normalisation

Cours 5 - Environnements en reacuteseau Internet et Web

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 4

Objectifs viseacutes matiegravere du cours et activiteacutes associeacutees

Lien entre les objectifs la matiegravere du cours 5 et les activiteacutes associeacutees

Objectif geacuteneacuteral Comprendre la place des technologies et de linformation numeacuterique en contexte documentaire

Objectifs speacutecifiques Matiegravere Activiteacutes

Expliquer les concepts fondamentaux des environnements en reacuteseau

Donneacutees ouvertes TP Donneacutees

Donneacutees lieacutees TP Donneacutees

Donneacutees de recherche TP Donneacutees

3 Introduction

Afin de bien vivre dans lenvironnement reacuteseauteacute omnipreacutesent dans le quotidien des professionnelles et professionnels de linformation en sus des concepts de bases des environnements reacuteseauteacutes il est important de comprendre un des reacuteseaux que lon croise au quotidien soit le Web Les milieux documentaires ont inteacutegreacute le Web comme plateforme pour

leurs ressources et leurs services avec les deacutefis qui en deacutecoulent soulignent en effet que ces Lankes et al (2007)

derniers sont multiples entre autres pour linteacutegration du Web 20 au sein de leurs systegravemes dinformation tant sur le plan politique et eacutethique quopeacuterationnel et technique Une attention particuliegravere doit ecirctre porteacutee agrave chacune des composantes de l organisation 20 (acteurs infrastructures etc) et agrave son insertion dans son environnement informationnel (

)Dufour amp Cadieux 2013

Apregraves avoir preacuteciseacute les bases de leacutevolution du Web nous nous inteacuteresserons agrave la culture numeacuterique qui en deacutecoule Nous enchaicircnerons par la suite sur les principaux types de donneacutees quon y retrouve ainsi que sur limportance de la normalisation dans ces environnements reacuteseauteacutes

4 Eacutevolution dInternet et du Web

Dans sa conceptualisation lhistoire de lInternet et du Web remonte aux anneacutees 40 lorsque Vannevar Bush a recircveacute dun univers de documents interconnecteacutes en reacuteaction agrave lexplosion documentaire quil observait Bien quil nait pas lui-mecircme inventeacute le terme hypertexte cest une des premiegraveres instances de ce concept Dans sa concreacutetisation technique cest dans les anneacutees 60 que le premier nœud de ce qui deviendra Internet a eacuteteacute mis en place par leacutequipe de Tim Berners Lee

5 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Quelques dates importantes dans lhistoire dInternet et du Web

On remarque que le deacutelai entre les moments cleacutes se raccourcit plus le temps avance En fait cette observation peut se faire plus globalement lorsque lon observe ladoption des technologies Ceci est eacutevident si on compare le temps pris pour atteindre 50 millions dauditeurs pour certaines technologies marquantes dans notre histoire la radio a pris 38 ans la teacuteleacutevision 13 ans Internet 4 ans le iPod 3 ans et Facebook 2 ans ( Did you know 30 2012 source httpwwwyoutube

il est agrave noter que dautres sources donnent des chiffres un peu diffeacuterents par exemple comwatchv=YmwwrGV_aiE mais une tendance similaire est observable)httpstwittercomGuglielminettistatus919245063967911937

Si le rythme est essoufflant pour lutilisateur qui veut rester agrave jour il lest encore plus pour les organisations dont les activiteacutes sont eacutetroitement lieacutees avec ces environnements numeacuteriques Cela leur demande decirctre de plus en plus agiles dans leur inteacutegration des technologies et de shabituer aux changements perpeacutetuels ce qui nest pas toujours facile dun point de vue humain et organisationnel

Lhistoire dInternet et du Web est jalonneacutee de moments cleacutes qui seront deacutecrits dans les sections qui suivent

41 Internet

Dentreacutee de jeu il est important de bien comprendre que les termes et ne sont pas synonymes On retrouve Internet Webparfois une certaine confusion entre les deux termes Plus preacuteciseacutement on peut deacutefinir Internet ainsi

A huge computer network available to everyone with a personal computer and a means to connect to it It is the actual physical network made up of wires cables and satellites as opposed to the web which is the multimedia interface to resources available on the Internet

(Source 2019 p 367)OLeary et al

Le Web est ainsi une des sphegraveres dInternet Internet eacutetant un reacuteseau plus large regroupant diffeacuterentes sphegraveres (Web courriel FTP etc)

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 6

bullbullbullbull

bullbullbull

Internet est neacute dune initiative militaire ameacutericaine Le premier nœud du reacuteseau ARPANET (Advanced Research Project ) agrave lorigine dInternet a eacuteteacute mis en place en 1969 Avant lapparition du Web les eacutechanges sur Internet Agency Network

eacutetaient uniquement textuels preacutecisent quune des cleacutes du deacuteveloppement rapide dInternet est le fait Leiner et al (1997)

que la documentation et plus particuliegraverement les speacutecifications et les protocoles eacutetait accessible gratuitement et librement

42 Web

Comme preacuteciseacute dans la section preacuteceacutedente le Web est une interface graphique agrave des contenus sur Internet

Prior to the introduction of the web in 1992 the Internet was all text The web made it possible to provide a multimedia interface that includes graphics animations sound and video

(Source 2019 p 377)OLeary et al

Au cœur du Web se retrouve lideacutee des documents interconnecteacutes proposeacutes en 1945 par Vannevar Bush Dans son texte

il propose lideacutee dune machine nommeacutee MEMEX pour reacutesoudre les problegravemes lieacutes agrave lexplosion As We May Think

documentaire Cette derniegravere serait en effet en mesure de ranger et rendre accessible tous les documents en permettant

La visualisation des documents sur microfilm sur un eacutecran documents pouvant ecirctre compleacuteteacutes par des imagesLa localisation des documentsLinclusion de pistes associatives entre les documents

Le neacuteologisme hypertexte a eacuteteacute proposeacute par le philosophe et sociologue ameacutericain Theodore Nelson en 1965 Il est agrave lorigine du projet Xanadu dont lobjectif eacutetait de regrouper tous les documents de lhumaniteacute Ce systegraveme accessible agrave tous permettrait lajout de documents et la deacutefinition de liens entre ces derniers Au deacutepart il sagissait uniquement dune conceptualisation sans impleacutementation Depuis des deacutemonstrations ont vu le jour apregraves bien des anneacutees dont

en OpenXanadu 2014

Le premier logiciel hypertexte grand public creacuteeacute par Bill Atkinson est HyperCard (Apple) en 1987 logiciel dont le deacuteveloppement sest termineacute en 1998 Il permettait de preacutesenter des contenus multimeacutedias sur des fiches virtuelles cartonneacutees cartes qui pouvaient ecirctre lieacutees entre elles par des boutons Pour les curieux et les curieuses (ou les nostalgiques) Internet Archive a mis en ligne en 2017 pour fecircter les 30 ans dHyperCard une collection de projets

HyperCard

Finalement lapplication la plus connue du modegravele hypertextuel le Web a eacuteteacute creacuteeacutee au CERN par leacutequipe de Tim Berners-Lee en 1989 Il sagit dune version alleacutegeacutee des visions initialement proposeacutees pour lhypertexte entre autres par T Nelson et V Bush

Absence de gestion des droits dauteurLiens unidirectionnels se cassant lorsque la ressource disparaicirctAbsence daperccedilu des ressources lieacuteesAbsence de systegraveme dannotation et de gestion de versions

7 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Le Web est passeacute par diffeacuterentes phases (Web 10 Web 20 et Web 30) qui seront deacutecrites dans les sections subseacutequentes

421 Web 10 Les premiegraveres anneacutees statiques du Web

La premiegravere version du Web le Web 10 en quelque sorte que certains deacutesignent comme un Web de documents correspond agrave un Web ougrave un petit nombre dinternautes eacutetaient des creacuteateurs de contenus cette creacuteation demandant en effet des compeacutetences informatiques plus avanceacutees La majoriteacute des internautes eacutetait ainsi des observateurs pouvant chercher parmi les informations existantes et les consulter Maignien (2014) le compare agrave une bibliothegraveque distribueacutee sans murs

Le modegravele documentaire est alors clairement celui dune bibliothegraveque distribueacutee sans murs autrement appeleacutee bibliothegraveque virtuelle ou numeacuterique mais ougrave linformation nest pas classeacutee de faccedilon hieacuterarchiseacutee dans un arbre mais distribueacutee en graphe (il existe autant de relations non hieacuterarchiseacutees que de liaisons possibles entre les documents ou des parties de ces documents)

(Source p 78)Maignien 2014

422 Web 20 Le Web participatif

La geacuteneacuteration suivante le Web 20 est un pheacutenomegravene agrave la fois technologique et social ce que fait bien ressortir cette deacutefinition

Web doteacute doutils et de contenus interactifs qui permettent aux internautes de participer agrave la creacuteation de contenus Web de partager de linformation en ligne et de communiquer entre eux

(Source Grand dictionnaire terminologique 2018 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26519897

Les mots-cleacutes ici sont participer creacuteation de contenus et partager Certains services et certaines technologies phares sont associeacutes au Web 20

Principaux services et technologies phares du Web 20

ServicesTechnologies Deacutefinition Exemples

Blogues Site Web ou section de site Web geacuteneacuteralement tenus par une seule personne consacreacutes agrave une chronique personnelle ou agrave une theacutematique particuliegravere preacutesenteacutees sous forme de billets ou darticles (OQLF 2018 httpgdtoqlfgouvqccaficheOqlfaspx

)Id_Fiche=8370242

Bibliomancienne

Archives 21

Microblogues Blogue permettant de communiquer en temps reacuteel au moyen de messages courts de 140 agrave 240 caractegraveres le plus souvent par lintermeacutediaire dune plateforme de microblogage afin de partager de linformation avec une communauteacute dinternautes (OQLF 2018

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26502311

Bruno Guglielminetti

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 3: SCI6005 Information numérique et informatique documentaire

3 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbull

1 + Au programme aujourdhui

Eacutevolution du Web et dInternetTypes de donneacutees sur le WebImportance de la normalisation

2 + Alignement peacutedagogique

Objectifs viseacutes mateacuteriel du cours et eacutevaluation Examen mi-session

Lien entre les objectifs les compeacutetences agrave deacutevelopper et le mateacuteriel du cours 5

Objectif geacuteneacuteral Comprendre la place des technologies et de linformation numeacuterique en contexte documentaire

Objectifs speacutecifiques Compeacutetences agrave deacutevelopper Mateacuteriel associeacute

Expliquer les concepts fondamentaux des environnements en reacuteseau

Deacutefinir ce quest Internet le Web 10 le Web 20 et le Web 30

Section Eacutevolution dInternet et du Web

Donner des exemples de plateformes 20 Section Eacutevolution dInternet et du Web gt Historique du Web et dInternet gt Web gt Web 20 Le Web participatif

Expliquer les enjeux lieacutes agrave leacutevolution du Web Section Eacutevolution dInternet et du Web gt Culture informationnelle et numeacuterique sur le Web

Expliquer ce que sont les donneacutees ouvertes les donneacutees lieacutees et les donneacutees de recherche

Section Donneacutees sur le Web

TP Donneacutees

Donner des raisons justifiant limportance de la normalisation

Section Importance de la normalisation

Cours 5 - Environnements en reacuteseau Internet et Web

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 4

Objectifs viseacutes matiegravere du cours et activiteacutes associeacutees

Lien entre les objectifs la matiegravere du cours 5 et les activiteacutes associeacutees

Objectif geacuteneacuteral Comprendre la place des technologies et de linformation numeacuterique en contexte documentaire

Objectifs speacutecifiques Matiegravere Activiteacutes

Expliquer les concepts fondamentaux des environnements en reacuteseau

Donneacutees ouvertes TP Donneacutees

Donneacutees lieacutees TP Donneacutees

Donneacutees de recherche TP Donneacutees

3 Introduction

Afin de bien vivre dans lenvironnement reacuteseauteacute omnipreacutesent dans le quotidien des professionnelles et professionnels de linformation en sus des concepts de bases des environnements reacuteseauteacutes il est important de comprendre un des reacuteseaux que lon croise au quotidien soit le Web Les milieux documentaires ont inteacutegreacute le Web comme plateforme pour

leurs ressources et leurs services avec les deacutefis qui en deacutecoulent soulignent en effet que ces Lankes et al (2007)

derniers sont multiples entre autres pour linteacutegration du Web 20 au sein de leurs systegravemes dinformation tant sur le plan politique et eacutethique quopeacuterationnel et technique Une attention particuliegravere doit ecirctre porteacutee agrave chacune des composantes de l organisation 20 (acteurs infrastructures etc) et agrave son insertion dans son environnement informationnel (

)Dufour amp Cadieux 2013

Apregraves avoir preacuteciseacute les bases de leacutevolution du Web nous nous inteacuteresserons agrave la culture numeacuterique qui en deacutecoule Nous enchaicircnerons par la suite sur les principaux types de donneacutees quon y retrouve ainsi que sur limportance de la normalisation dans ces environnements reacuteseauteacutes

4 Eacutevolution dInternet et du Web

Dans sa conceptualisation lhistoire de lInternet et du Web remonte aux anneacutees 40 lorsque Vannevar Bush a recircveacute dun univers de documents interconnecteacutes en reacuteaction agrave lexplosion documentaire quil observait Bien quil nait pas lui-mecircme inventeacute le terme hypertexte cest une des premiegraveres instances de ce concept Dans sa concreacutetisation technique cest dans les anneacutees 60 que le premier nœud de ce qui deviendra Internet a eacuteteacute mis en place par leacutequipe de Tim Berners Lee

5 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Quelques dates importantes dans lhistoire dInternet et du Web

On remarque que le deacutelai entre les moments cleacutes se raccourcit plus le temps avance En fait cette observation peut se faire plus globalement lorsque lon observe ladoption des technologies Ceci est eacutevident si on compare le temps pris pour atteindre 50 millions dauditeurs pour certaines technologies marquantes dans notre histoire la radio a pris 38 ans la teacuteleacutevision 13 ans Internet 4 ans le iPod 3 ans et Facebook 2 ans ( Did you know 30 2012 source httpwwwyoutube

il est agrave noter que dautres sources donnent des chiffres un peu diffeacuterents par exemple comwatchv=YmwwrGV_aiE mais une tendance similaire est observable)httpstwittercomGuglielminettistatus919245063967911937

Si le rythme est essoufflant pour lutilisateur qui veut rester agrave jour il lest encore plus pour les organisations dont les activiteacutes sont eacutetroitement lieacutees avec ces environnements numeacuteriques Cela leur demande decirctre de plus en plus agiles dans leur inteacutegration des technologies et de shabituer aux changements perpeacutetuels ce qui nest pas toujours facile dun point de vue humain et organisationnel

Lhistoire dInternet et du Web est jalonneacutee de moments cleacutes qui seront deacutecrits dans les sections qui suivent

41 Internet

Dentreacutee de jeu il est important de bien comprendre que les termes et ne sont pas synonymes On retrouve Internet Webparfois une certaine confusion entre les deux termes Plus preacuteciseacutement on peut deacutefinir Internet ainsi

A huge computer network available to everyone with a personal computer and a means to connect to it It is the actual physical network made up of wires cables and satellites as opposed to the web which is the multimedia interface to resources available on the Internet

(Source 2019 p 367)OLeary et al

Le Web est ainsi une des sphegraveres dInternet Internet eacutetant un reacuteseau plus large regroupant diffeacuterentes sphegraveres (Web courriel FTP etc)

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 6

bullbullbullbull

bullbullbull

Internet est neacute dune initiative militaire ameacutericaine Le premier nœud du reacuteseau ARPANET (Advanced Research Project ) agrave lorigine dInternet a eacuteteacute mis en place en 1969 Avant lapparition du Web les eacutechanges sur Internet Agency Network

eacutetaient uniquement textuels preacutecisent quune des cleacutes du deacuteveloppement rapide dInternet est le fait Leiner et al (1997)

que la documentation et plus particuliegraverement les speacutecifications et les protocoles eacutetait accessible gratuitement et librement

42 Web

Comme preacuteciseacute dans la section preacuteceacutedente le Web est une interface graphique agrave des contenus sur Internet

Prior to the introduction of the web in 1992 the Internet was all text The web made it possible to provide a multimedia interface that includes graphics animations sound and video

(Source 2019 p 377)OLeary et al

Au cœur du Web se retrouve lideacutee des documents interconnecteacutes proposeacutes en 1945 par Vannevar Bush Dans son texte

il propose lideacutee dune machine nommeacutee MEMEX pour reacutesoudre les problegravemes lieacutes agrave lexplosion As We May Think

documentaire Cette derniegravere serait en effet en mesure de ranger et rendre accessible tous les documents en permettant

La visualisation des documents sur microfilm sur un eacutecran documents pouvant ecirctre compleacuteteacutes par des imagesLa localisation des documentsLinclusion de pistes associatives entre les documents

Le neacuteologisme hypertexte a eacuteteacute proposeacute par le philosophe et sociologue ameacutericain Theodore Nelson en 1965 Il est agrave lorigine du projet Xanadu dont lobjectif eacutetait de regrouper tous les documents de lhumaniteacute Ce systegraveme accessible agrave tous permettrait lajout de documents et la deacutefinition de liens entre ces derniers Au deacutepart il sagissait uniquement dune conceptualisation sans impleacutementation Depuis des deacutemonstrations ont vu le jour apregraves bien des anneacutees dont

en OpenXanadu 2014

Le premier logiciel hypertexte grand public creacuteeacute par Bill Atkinson est HyperCard (Apple) en 1987 logiciel dont le deacuteveloppement sest termineacute en 1998 Il permettait de preacutesenter des contenus multimeacutedias sur des fiches virtuelles cartonneacutees cartes qui pouvaient ecirctre lieacutees entre elles par des boutons Pour les curieux et les curieuses (ou les nostalgiques) Internet Archive a mis en ligne en 2017 pour fecircter les 30 ans dHyperCard une collection de projets

HyperCard

Finalement lapplication la plus connue du modegravele hypertextuel le Web a eacuteteacute creacuteeacutee au CERN par leacutequipe de Tim Berners-Lee en 1989 Il sagit dune version alleacutegeacutee des visions initialement proposeacutees pour lhypertexte entre autres par T Nelson et V Bush

Absence de gestion des droits dauteurLiens unidirectionnels se cassant lorsque la ressource disparaicirctAbsence daperccedilu des ressources lieacuteesAbsence de systegraveme dannotation et de gestion de versions

7 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Le Web est passeacute par diffeacuterentes phases (Web 10 Web 20 et Web 30) qui seront deacutecrites dans les sections subseacutequentes

421 Web 10 Les premiegraveres anneacutees statiques du Web

La premiegravere version du Web le Web 10 en quelque sorte que certains deacutesignent comme un Web de documents correspond agrave un Web ougrave un petit nombre dinternautes eacutetaient des creacuteateurs de contenus cette creacuteation demandant en effet des compeacutetences informatiques plus avanceacutees La majoriteacute des internautes eacutetait ainsi des observateurs pouvant chercher parmi les informations existantes et les consulter Maignien (2014) le compare agrave une bibliothegraveque distribueacutee sans murs

Le modegravele documentaire est alors clairement celui dune bibliothegraveque distribueacutee sans murs autrement appeleacutee bibliothegraveque virtuelle ou numeacuterique mais ougrave linformation nest pas classeacutee de faccedilon hieacuterarchiseacutee dans un arbre mais distribueacutee en graphe (il existe autant de relations non hieacuterarchiseacutees que de liaisons possibles entre les documents ou des parties de ces documents)

(Source p 78)Maignien 2014

422 Web 20 Le Web participatif

La geacuteneacuteration suivante le Web 20 est un pheacutenomegravene agrave la fois technologique et social ce que fait bien ressortir cette deacutefinition

Web doteacute doutils et de contenus interactifs qui permettent aux internautes de participer agrave la creacuteation de contenus Web de partager de linformation en ligne et de communiquer entre eux

(Source Grand dictionnaire terminologique 2018 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26519897

Les mots-cleacutes ici sont participer creacuteation de contenus et partager Certains services et certaines technologies phares sont associeacutes au Web 20

Principaux services et technologies phares du Web 20

ServicesTechnologies Deacutefinition Exemples

Blogues Site Web ou section de site Web geacuteneacuteralement tenus par une seule personne consacreacutes agrave une chronique personnelle ou agrave une theacutematique particuliegravere preacutesenteacutees sous forme de billets ou darticles (OQLF 2018 httpgdtoqlfgouvqccaficheOqlfaspx

)Id_Fiche=8370242

Bibliomancienne

Archives 21

Microblogues Blogue permettant de communiquer en temps reacuteel au moyen de messages courts de 140 agrave 240 caractegraveres le plus souvent par lintermeacutediaire dune plateforme de microblogage afin de partager de linformation avec une communauteacute dinternautes (OQLF 2018

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26502311

Bruno Guglielminetti

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 4: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 4

Objectifs viseacutes matiegravere du cours et activiteacutes associeacutees

Lien entre les objectifs la matiegravere du cours 5 et les activiteacutes associeacutees

Objectif geacuteneacuteral Comprendre la place des technologies et de linformation numeacuterique en contexte documentaire

Objectifs speacutecifiques Matiegravere Activiteacutes

Expliquer les concepts fondamentaux des environnements en reacuteseau

Donneacutees ouvertes TP Donneacutees

Donneacutees lieacutees TP Donneacutees

Donneacutees de recherche TP Donneacutees

3 Introduction

Afin de bien vivre dans lenvironnement reacuteseauteacute omnipreacutesent dans le quotidien des professionnelles et professionnels de linformation en sus des concepts de bases des environnements reacuteseauteacutes il est important de comprendre un des reacuteseaux que lon croise au quotidien soit le Web Les milieux documentaires ont inteacutegreacute le Web comme plateforme pour

leurs ressources et leurs services avec les deacutefis qui en deacutecoulent soulignent en effet que ces Lankes et al (2007)

derniers sont multiples entre autres pour linteacutegration du Web 20 au sein de leurs systegravemes dinformation tant sur le plan politique et eacutethique quopeacuterationnel et technique Une attention particuliegravere doit ecirctre porteacutee agrave chacune des composantes de l organisation 20 (acteurs infrastructures etc) et agrave son insertion dans son environnement informationnel (

)Dufour amp Cadieux 2013

Apregraves avoir preacuteciseacute les bases de leacutevolution du Web nous nous inteacuteresserons agrave la culture numeacuterique qui en deacutecoule Nous enchaicircnerons par la suite sur les principaux types de donneacutees quon y retrouve ainsi que sur limportance de la normalisation dans ces environnements reacuteseauteacutes

4 Eacutevolution dInternet et du Web

Dans sa conceptualisation lhistoire de lInternet et du Web remonte aux anneacutees 40 lorsque Vannevar Bush a recircveacute dun univers de documents interconnecteacutes en reacuteaction agrave lexplosion documentaire quil observait Bien quil nait pas lui-mecircme inventeacute le terme hypertexte cest une des premiegraveres instances de ce concept Dans sa concreacutetisation technique cest dans les anneacutees 60 que le premier nœud de ce qui deviendra Internet a eacuteteacute mis en place par leacutequipe de Tim Berners Lee

5 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Quelques dates importantes dans lhistoire dInternet et du Web

On remarque que le deacutelai entre les moments cleacutes se raccourcit plus le temps avance En fait cette observation peut se faire plus globalement lorsque lon observe ladoption des technologies Ceci est eacutevident si on compare le temps pris pour atteindre 50 millions dauditeurs pour certaines technologies marquantes dans notre histoire la radio a pris 38 ans la teacuteleacutevision 13 ans Internet 4 ans le iPod 3 ans et Facebook 2 ans ( Did you know 30 2012 source httpwwwyoutube

il est agrave noter que dautres sources donnent des chiffres un peu diffeacuterents par exemple comwatchv=YmwwrGV_aiE mais une tendance similaire est observable)httpstwittercomGuglielminettistatus919245063967911937

Si le rythme est essoufflant pour lutilisateur qui veut rester agrave jour il lest encore plus pour les organisations dont les activiteacutes sont eacutetroitement lieacutees avec ces environnements numeacuteriques Cela leur demande decirctre de plus en plus agiles dans leur inteacutegration des technologies et de shabituer aux changements perpeacutetuels ce qui nest pas toujours facile dun point de vue humain et organisationnel

Lhistoire dInternet et du Web est jalonneacutee de moments cleacutes qui seront deacutecrits dans les sections qui suivent

41 Internet

Dentreacutee de jeu il est important de bien comprendre que les termes et ne sont pas synonymes On retrouve Internet Webparfois une certaine confusion entre les deux termes Plus preacuteciseacutement on peut deacutefinir Internet ainsi

A huge computer network available to everyone with a personal computer and a means to connect to it It is the actual physical network made up of wires cables and satellites as opposed to the web which is the multimedia interface to resources available on the Internet

(Source 2019 p 367)OLeary et al

Le Web est ainsi une des sphegraveres dInternet Internet eacutetant un reacuteseau plus large regroupant diffeacuterentes sphegraveres (Web courriel FTP etc)

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 6

bullbullbullbull

bullbullbull

Internet est neacute dune initiative militaire ameacutericaine Le premier nœud du reacuteseau ARPANET (Advanced Research Project ) agrave lorigine dInternet a eacuteteacute mis en place en 1969 Avant lapparition du Web les eacutechanges sur Internet Agency Network

eacutetaient uniquement textuels preacutecisent quune des cleacutes du deacuteveloppement rapide dInternet est le fait Leiner et al (1997)

que la documentation et plus particuliegraverement les speacutecifications et les protocoles eacutetait accessible gratuitement et librement

42 Web

Comme preacuteciseacute dans la section preacuteceacutedente le Web est une interface graphique agrave des contenus sur Internet

Prior to the introduction of the web in 1992 the Internet was all text The web made it possible to provide a multimedia interface that includes graphics animations sound and video

(Source 2019 p 377)OLeary et al

Au cœur du Web se retrouve lideacutee des documents interconnecteacutes proposeacutes en 1945 par Vannevar Bush Dans son texte

il propose lideacutee dune machine nommeacutee MEMEX pour reacutesoudre les problegravemes lieacutes agrave lexplosion As We May Think

documentaire Cette derniegravere serait en effet en mesure de ranger et rendre accessible tous les documents en permettant

La visualisation des documents sur microfilm sur un eacutecran documents pouvant ecirctre compleacuteteacutes par des imagesLa localisation des documentsLinclusion de pistes associatives entre les documents

Le neacuteologisme hypertexte a eacuteteacute proposeacute par le philosophe et sociologue ameacutericain Theodore Nelson en 1965 Il est agrave lorigine du projet Xanadu dont lobjectif eacutetait de regrouper tous les documents de lhumaniteacute Ce systegraveme accessible agrave tous permettrait lajout de documents et la deacutefinition de liens entre ces derniers Au deacutepart il sagissait uniquement dune conceptualisation sans impleacutementation Depuis des deacutemonstrations ont vu le jour apregraves bien des anneacutees dont

en OpenXanadu 2014

Le premier logiciel hypertexte grand public creacuteeacute par Bill Atkinson est HyperCard (Apple) en 1987 logiciel dont le deacuteveloppement sest termineacute en 1998 Il permettait de preacutesenter des contenus multimeacutedias sur des fiches virtuelles cartonneacutees cartes qui pouvaient ecirctre lieacutees entre elles par des boutons Pour les curieux et les curieuses (ou les nostalgiques) Internet Archive a mis en ligne en 2017 pour fecircter les 30 ans dHyperCard une collection de projets

HyperCard

Finalement lapplication la plus connue du modegravele hypertextuel le Web a eacuteteacute creacuteeacutee au CERN par leacutequipe de Tim Berners-Lee en 1989 Il sagit dune version alleacutegeacutee des visions initialement proposeacutees pour lhypertexte entre autres par T Nelson et V Bush

Absence de gestion des droits dauteurLiens unidirectionnels se cassant lorsque la ressource disparaicirctAbsence daperccedilu des ressources lieacuteesAbsence de systegraveme dannotation et de gestion de versions

7 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Le Web est passeacute par diffeacuterentes phases (Web 10 Web 20 et Web 30) qui seront deacutecrites dans les sections subseacutequentes

421 Web 10 Les premiegraveres anneacutees statiques du Web

La premiegravere version du Web le Web 10 en quelque sorte que certains deacutesignent comme un Web de documents correspond agrave un Web ougrave un petit nombre dinternautes eacutetaient des creacuteateurs de contenus cette creacuteation demandant en effet des compeacutetences informatiques plus avanceacutees La majoriteacute des internautes eacutetait ainsi des observateurs pouvant chercher parmi les informations existantes et les consulter Maignien (2014) le compare agrave une bibliothegraveque distribueacutee sans murs

Le modegravele documentaire est alors clairement celui dune bibliothegraveque distribueacutee sans murs autrement appeleacutee bibliothegraveque virtuelle ou numeacuterique mais ougrave linformation nest pas classeacutee de faccedilon hieacuterarchiseacutee dans un arbre mais distribueacutee en graphe (il existe autant de relations non hieacuterarchiseacutees que de liaisons possibles entre les documents ou des parties de ces documents)

(Source p 78)Maignien 2014

422 Web 20 Le Web participatif

La geacuteneacuteration suivante le Web 20 est un pheacutenomegravene agrave la fois technologique et social ce que fait bien ressortir cette deacutefinition

Web doteacute doutils et de contenus interactifs qui permettent aux internautes de participer agrave la creacuteation de contenus Web de partager de linformation en ligne et de communiquer entre eux

(Source Grand dictionnaire terminologique 2018 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26519897

Les mots-cleacutes ici sont participer creacuteation de contenus et partager Certains services et certaines technologies phares sont associeacutes au Web 20

Principaux services et technologies phares du Web 20

ServicesTechnologies Deacutefinition Exemples

Blogues Site Web ou section de site Web geacuteneacuteralement tenus par une seule personne consacreacutes agrave une chronique personnelle ou agrave une theacutematique particuliegravere preacutesenteacutees sous forme de billets ou darticles (OQLF 2018 httpgdtoqlfgouvqccaficheOqlfaspx

)Id_Fiche=8370242

Bibliomancienne

Archives 21

Microblogues Blogue permettant de communiquer en temps reacuteel au moyen de messages courts de 140 agrave 240 caractegraveres le plus souvent par lintermeacutediaire dune plateforme de microblogage afin de partager de linformation avec une communauteacute dinternautes (OQLF 2018

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26502311

Bruno Guglielminetti

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 5: SCI6005 Information numérique et informatique documentaire

5 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Quelques dates importantes dans lhistoire dInternet et du Web

On remarque que le deacutelai entre les moments cleacutes se raccourcit plus le temps avance En fait cette observation peut se faire plus globalement lorsque lon observe ladoption des technologies Ceci est eacutevident si on compare le temps pris pour atteindre 50 millions dauditeurs pour certaines technologies marquantes dans notre histoire la radio a pris 38 ans la teacuteleacutevision 13 ans Internet 4 ans le iPod 3 ans et Facebook 2 ans ( Did you know 30 2012 source httpwwwyoutube

il est agrave noter que dautres sources donnent des chiffres un peu diffeacuterents par exemple comwatchv=YmwwrGV_aiE mais une tendance similaire est observable)httpstwittercomGuglielminettistatus919245063967911937

Si le rythme est essoufflant pour lutilisateur qui veut rester agrave jour il lest encore plus pour les organisations dont les activiteacutes sont eacutetroitement lieacutees avec ces environnements numeacuteriques Cela leur demande decirctre de plus en plus agiles dans leur inteacutegration des technologies et de shabituer aux changements perpeacutetuels ce qui nest pas toujours facile dun point de vue humain et organisationnel

Lhistoire dInternet et du Web est jalonneacutee de moments cleacutes qui seront deacutecrits dans les sections qui suivent

41 Internet

Dentreacutee de jeu il est important de bien comprendre que les termes et ne sont pas synonymes On retrouve Internet Webparfois une certaine confusion entre les deux termes Plus preacuteciseacutement on peut deacutefinir Internet ainsi

A huge computer network available to everyone with a personal computer and a means to connect to it It is the actual physical network made up of wires cables and satellites as opposed to the web which is the multimedia interface to resources available on the Internet

(Source 2019 p 367)OLeary et al

Le Web est ainsi une des sphegraveres dInternet Internet eacutetant un reacuteseau plus large regroupant diffeacuterentes sphegraveres (Web courriel FTP etc)

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 6

bullbullbullbull

bullbullbull

Internet est neacute dune initiative militaire ameacutericaine Le premier nœud du reacuteseau ARPANET (Advanced Research Project ) agrave lorigine dInternet a eacuteteacute mis en place en 1969 Avant lapparition du Web les eacutechanges sur Internet Agency Network

eacutetaient uniquement textuels preacutecisent quune des cleacutes du deacuteveloppement rapide dInternet est le fait Leiner et al (1997)

que la documentation et plus particuliegraverement les speacutecifications et les protocoles eacutetait accessible gratuitement et librement

42 Web

Comme preacuteciseacute dans la section preacuteceacutedente le Web est une interface graphique agrave des contenus sur Internet

Prior to the introduction of the web in 1992 the Internet was all text The web made it possible to provide a multimedia interface that includes graphics animations sound and video

(Source 2019 p 377)OLeary et al

Au cœur du Web se retrouve lideacutee des documents interconnecteacutes proposeacutes en 1945 par Vannevar Bush Dans son texte

il propose lideacutee dune machine nommeacutee MEMEX pour reacutesoudre les problegravemes lieacutes agrave lexplosion As We May Think

documentaire Cette derniegravere serait en effet en mesure de ranger et rendre accessible tous les documents en permettant

La visualisation des documents sur microfilm sur un eacutecran documents pouvant ecirctre compleacuteteacutes par des imagesLa localisation des documentsLinclusion de pistes associatives entre les documents

Le neacuteologisme hypertexte a eacuteteacute proposeacute par le philosophe et sociologue ameacutericain Theodore Nelson en 1965 Il est agrave lorigine du projet Xanadu dont lobjectif eacutetait de regrouper tous les documents de lhumaniteacute Ce systegraveme accessible agrave tous permettrait lajout de documents et la deacutefinition de liens entre ces derniers Au deacutepart il sagissait uniquement dune conceptualisation sans impleacutementation Depuis des deacutemonstrations ont vu le jour apregraves bien des anneacutees dont

en OpenXanadu 2014

Le premier logiciel hypertexte grand public creacuteeacute par Bill Atkinson est HyperCard (Apple) en 1987 logiciel dont le deacuteveloppement sest termineacute en 1998 Il permettait de preacutesenter des contenus multimeacutedias sur des fiches virtuelles cartonneacutees cartes qui pouvaient ecirctre lieacutees entre elles par des boutons Pour les curieux et les curieuses (ou les nostalgiques) Internet Archive a mis en ligne en 2017 pour fecircter les 30 ans dHyperCard une collection de projets

HyperCard

Finalement lapplication la plus connue du modegravele hypertextuel le Web a eacuteteacute creacuteeacutee au CERN par leacutequipe de Tim Berners-Lee en 1989 Il sagit dune version alleacutegeacutee des visions initialement proposeacutees pour lhypertexte entre autres par T Nelson et V Bush

Absence de gestion des droits dauteurLiens unidirectionnels se cassant lorsque la ressource disparaicirctAbsence daperccedilu des ressources lieacuteesAbsence de systegraveme dannotation et de gestion de versions

7 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Le Web est passeacute par diffeacuterentes phases (Web 10 Web 20 et Web 30) qui seront deacutecrites dans les sections subseacutequentes

421 Web 10 Les premiegraveres anneacutees statiques du Web

La premiegravere version du Web le Web 10 en quelque sorte que certains deacutesignent comme un Web de documents correspond agrave un Web ougrave un petit nombre dinternautes eacutetaient des creacuteateurs de contenus cette creacuteation demandant en effet des compeacutetences informatiques plus avanceacutees La majoriteacute des internautes eacutetait ainsi des observateurs pouvant chercher parmi les informations existantes et les consulter Maignien (2014) le compare agrave une bibliothegraveque distribueacutee sans murs

Le modegravele documentaire est alors clairement celui dune bibliothegraveque distribueacutee sans murs autrement appeleacutee bibliothegraveque virtuelle ou numeacuterique mais ougrave linformation nest pas classeacutee de faccedilon hieacuterarchiseacutee dans un arbre mais distribueacutee en graphe (il existe autant de relations non hieacuterarchiseacutees que de liaisons possibles entre les documents ou des parties de ces documents)

(Source p 78)Maignien 2014

422 Web 20 Le Web participatif

La geacuteneacuteration suivante le Web 20 est un pheacutenomegravene agrave la fois technologique et social ce que fait bien ressortir cette deacutefinition

Web doteacute doutils et de contenus interactifs qui permettent aux internautes de participer agrave la creacuteation de contenus Web de partager de linformation en ligne et de communiquer entre eux

(Source Grand dictionnaire terminologique 2018 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26519897

Les mots-cleacutes ici sont participer creacuteation de contenus et partager Certains services et certaines technologies phares sont associeacutes au Web 20

Principaux services et technologies phares du Web 20

ServicesTechnologies Deacutefinition Exemples

Blogues Site Web ou section de site Web geacuteneacuteralement tenus par une seule personne consacreacutes agrave une chronique personnelle ou agrave une theacutematique particuliegravere preacutesenteacutees sous forme de billets ou darticles (OQLF 2018 httpgdtoqlfgouvqccaficheOqlfaspx

)Id_Fiche=8370242

Bibliomancienne

Archives 21

Microblogues Blogue permettant de communiquer en temps reacuteel au moyen de messages courts de 140 agrave 240 caractegraveres le plus souvent par lintermeacutediaire dune plateforme de microblogage afin de partager de linformation avec une communauteacute dinternautes (OQLF 2018

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26502311

Bruno Guglielminetti

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 6: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 6

bullbullbullbull

bullbullbull

Internet est neacute dune initiative militaire ameacutericaine Le premier nœud du reacuteseau ARPANET (Advanced Research Project ) agrave lorigine dInternet a eacuteteacute mis en place en 1969 Avant lapparition du Web les eacutechanges sur Internet Agency Network

eacutetaient uniquement textuels preacutecisent quune des cleacutes du deacuteveloppement rapide dInternet est le fait Leiner et al (1997)

que la documentation et plus particuliegraverement les speacutecifications et les protocoles eacutetait accessible gratuitement et librement

42 Web

Comme preacuteciseacute dans la section preacuteceacutedente le Web est une interface graphique agrave des contenus sur Internet

Prior to the introduction of the web in 1992 the Internet was all text The web made it possible to provide a multimedia interface that includes graphics animations sound and video

(Source 2019 p 377)OLeary et al

Au cœur du Web se retrouve lideacutee des documents interconnecteacutes proposeacutes en 1945 par Vannevar Bush Dans son texte

il propose lideacutee dune machine nommeacutee MEMEX pour reacutesoudre les problegravemes lieacutes agrave lexplosion As We May Think

documentaire Cette derniegravere serait en effet en mesure de ranger et rendre accessible tous les documents en permettant

La visualisation des documents sur microfilm sur un eacutecran documents pouvant ecirctre compleacuteteacutes par des imagesLa localisation des documentsLinclusion de pistes associatives entre les documents

Le neacuteologisme hypertexte a eacuteteacute proposeacute par le philosophe et sociologue ameacutericain Theodore Nelson en 1965 Il est agrave lorigine du projet Xanadu dont lobjectif eacutetait de regrouper tous les documents de lhumaniteacute Ce systegraveme accessible agrave tous permettrait lajout de documents et la deacutefinition de liens entre ces derniers Au deacutepart il sagissait uniquement dune conceptualisation sans impleacutementation Depuis des deacutemonstrations ont vu le jour apregraves bien des anneacutees dont

en OpenXanadu 2014

Le premier logiciel hypertexte grand public creacuteeacute par Bill Atkinson est HyperCard (Apple) en 1987 logiciel dont le deacuteveloppement sest termineacute en 1998 Il permettait de preacutesenter des contenus multimeacutedias sur des fiches virtuelles cartonneacutees cartes qui pouvaient ecirctre lieacutees entre elles par des boutons Pour les curieux et les curieuses (ou les nostalgiques) Internet Archive a mis en ligne en 2017 pour fecircter les 30 ans dHyperCard une collection de projets

HyperCard

Finalement lapplication la plus connue du modegravele hypertextuel le Web a eacuteteacute creacuteeacutee au CERN par leacutequipe de Tim Berners-Lee en 1989 Il sagit dune version alleacutegeacutee des visions initialement proposeacutees pour lhypertexte entre autres par T Nelson et V Bush

Absence de gestion des droits dauteurLiens unidirectionnels se cassant lorsque la ressource disparaicirctAbsence daperccedilu des ressources lieacuteesAbsence de systegraveme dannotation et de gestion de versions

7 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Le Web est passeacute par diffeacuterentes phases (Web 10 Web 20 et Web 30) qui seront deacutecrites dans les sections subseacutequentes

421 Web 10 Les premiegraveres anneacutees statiques du Web

La premiegravere version du Web le Web 10 en quelque sorte que certains deacutesignent comme un Web de documents correspond agrave un Web ougrave un petit nombre dinternautes eacutetaient des creacuteateurs de contenus cette creacuteation demandant en effet des compeacutetences informatiques plus avanceacutees La majoriteacute des internautes eacutetait ainsi des observateurs pouvant chercher parmi les informations existantes et les consulter Maignien (2014) le compare agrave une bibliothegraveque distribueacutee sans murs

Le modegravele documentaire est alors clairement celui dune bibliothegraveque distribueacutee sans murs autrement appeleacutee bibliothegraveque virtuelle ou numeacuterique mais ougrave linformation nest pas classeacutee de faccedilon hieacuterarchiseacutee dans un arbre mais distribueacutee en graphe (il existe autant de relations non hieacuterarchiseacutees que de liaisons possibles entre les documents ou des parties de ces documents)

(Source p 78)Maignien 2014

422 Web 20 Le Web participatif

La geacuteneacuteration suivante le Web 20 est un pheacutenomegravene agrave la fois technologique et social ce que fait bien ressortir cette deacutefinition

Web doteacute doutils et de contenus interactifs qui permettent aux internautes de participer agrave la creacuteation de contenus Web de partager de linformation en ligne et de communiquer entre eux

(Source Grand dictionnaire terminologique 2018 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26519897

Les mots-cleacutes ici sont participer creacuteation de contenus et partager Certains services et certaines technologies phares sont associeacutes au Web 20

Principaux services et technologies phares du Web 20

ServicesTechnologies Deacutefinition Exemples

Blogues Site Web ou section de site Web geacuteneacuteralement tenus par une seule personne consacreacutes agrave une chronique personnelle ou agrave une theacutematique particuliegravere preacutesenteacutees sous forme de billets ou darticles (OQLF 2018 httpgdtoqlfgouvqccaficheOqlfaspx

)Id_Fiche=8370242

Bibliomancienne

Archives 21

Microblogues Blogue permettant de communiquer en temps reacuteel au moyen de messages courts de 140 agrave 240 caractegraveres le plus souvent par lintermeacutediaire dune plateforme de microblogage afin de partager de linformation avec une communauteacute dinternautes (OQLF 2018

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26502311

Bruno Guglielminetti

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 7: SCI6005 Information numérique et informatique documentaire

7 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Le Web est passeacute par diffeacuterentes phases (Web 10 Web 20 et Web 30) qui seront deacutecrites dans les sections subseacutequentes

421 Web 10 Les premiegraveres anneacutees statiques du Web

La premiegravere version du Web le Web 10 en quelque sorte que certains deacutesignent comme un Web de documents correspond agrave un Web ougrave un petit nombre dinternautes eacutetaient des creacuteateurs de contenus cette creacuteation demandant en effet des compeacutetences informatiques plus avanceacutees La majoriteacute des internautes eacutetait ainsi des observateurs pouvant chercher parmi les informations existantes et les consulter Maignien (2014) le compare agrave une bibliothegraveque distribueacutee sans murs

Le modegravele documentaire est alors clairement celui dune bibliothegraveque distribueacutee sans murs autrement appeleacutee bibliothegraveque virtuelle ou numeacuterique mais ougrave linformation nest pas classeacutee de faccedilon hieacuterarchiseacutee dans un arbre mais distribueacutee en graphe (il existe autant de relations non hieacuterarchiseacutees que de liaisons possibles entre les documents ou des parties de ces documents)

(Source p 78)Maignien 2014

422 Web 20 Le Web participatif

La geacuteneacuteration suivante le Web 20 est un pheacutenomegravene agrave la fois technologique et social ce que fait bien ressortir cette deacutefinition

Web doteacute doutils et de contenus interactifs qui permettent aux internautes de participer agrave la creacuteation de contenus Web de partager de linformation en ligne et de communiquer entre eux

(Source Grand dictionnaire terminologique 2018 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26519897

Les mots-cleacutes ici sont participer creacuteation de contenus et partager Certains services et certaines technologies phares sont associeacutes au Web 20

Principaux services et technologies phares du Web 20

ServicesTechnologies Deacutefinition Exemples

Blogues Site Web ou section de site Web geacuteneacuteralement tenus par une seule personne consacreacutes agrave une chronique personnelle ou agrave une theacutematique particuliegravere preacutesenteacutees sous forme de billets ou darticles (OQLF 2018 httpgdtoqlfgouvqccaficheOqlfaspx

)Id_Fiche=8370242

Bibliomancienne

Archives 21

Microblogues Blogue permettant de communiquer en temps reacuteel au moyen de messages courts de 140 agrave 240 caractegraveres le plus souvent par lintermeacutediaire dune plateforme de microblogage afin de partager de linformation avec une communauteacute dinternautes (OQLF 2018

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26502311

Bruno Guglielminetti

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 8: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 8

Wikis Site Web collaboratif ougrave chaque internaute visiteur peut participer agrave la reacutedaction du contenu (OQLF 2011 httpgdtoqlfgouvqcca

)ficheOqlfaspxId_Fiche=8362053

Wikipeacutedia

Reacuteseaux sociaux Environnements ougrave lutilisateur se deacutefinit un profil (personnel ou professionnel) et reacuteseaute avec dautres utilisateurs

Facebook (personnel)

LinkedIn (professionnel)

Plateformes de partage de ressources

Plateformes facilitant la composition de collections de ressources diverses et le partage de ces derniegraveres

Flickr (photographies)

YouTube (videacuteos)

Slideshare (preacutesentations powerpoint)

Fils de syndication Fil dinformation consistant en un fichier XML geacuteneacutereacute automatiquement dont le contenu formateacute exploitable dynamiquement par dautres sites Web est reacutecupeacuterable par lentremise dun agreacutegateur qui permet de lire le nouveau contenu de ce fil reacutepertorieacute degraves quil est disponible (OQLF 2006 httpgdtoqlf

)gouvqccaficheOqlfaspxId_Fiche=8869144

Formats les plus connus RSS et ATOM

Folksonomies Systegraveme de classification collaborative et spontaneacutee de contenus Internet baseacute sur lattribution de mots-cleacutes librement choisis par des utilisateurs non speacutecialistes qui favorise le partage de ressources et permet dameacuteliorer la recherche dinformation (OQLF 2006

)httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=8351986

Se retrouvent par exemple sur les plateformes de partage de ressources pour deacutecrire les ressources ou sur les blogues pour deacutecrire les billets

Lexpression Web 20 a eacuteteacute utiliseacutee pour la premiegravere fois en 2004 par leacutequipe dOReilly Media qui reprenant la meacutetaphore des numeacuteros de version pour les logiciels voulait indiquer une version ameacutelioreacutee du Web Certains lui preacutefegraverent maintenant lexpression Web social qui est en effet une de ses principales facettes Agrave ses deacutebuts certains voyaient le Web 20 comme un effet de mode et agrave lautre extrecircme dautres le percevaient comme un changement de paradigme Les chiffres qui croissent danneacutee en anneacutee montrent sans lombre dun doute quil ne sagissait pas dun effet de mode

Quelques chiffres sur certaines plateformes types du Web 20

Type Plateforme Chiffres Source

Partage de ressources

Instagram Plus dun milliard dutilisateurs

httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

YouTube Plus de 2 milliards dutilisateurs

Un milliard dheures regardeacutees par jour

httpswwwyoutubecomintlfraboutpress (2020-09-13)

Reacuteseaux sociaux LinkedIn httpsaboutlinkedincomfr-fr (2020-09-13)

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 9: SCI6005 Information numérique et informatique documentaire

9 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Plus de 645 millions dutilisateurs

Plus de 200 pays et territoires

Facebook Plus de 3 milliards dutilisateurs

Plus de 100 milliards de messages par jour

httpsaboutfbcomcompany-info (2020-09-13)

Reacutedaction collaborative

Wikipeacutedia 54 702 959 articles

2 249 067 articles en franccedilais

303 langues actives

httpsmetawikimediaorgwikiList_of_Wikipedias (2020-09-13)

Micro-blogosphegravere Twitter 326 millions dutilisateurs httpswwwstatistacomstatistics272014global-social-networks-ranked-by-number-of-users (2020-07)

Si on peut heacutesiter agrave parler dune reacutevolution il sagit tregraves clairement dune eacutevolution tant des technologies que de leur utilisation Linternaute qui le deacutesire a maintenant agrave sa porteacutee des technologies qui lui permettent de passer sil ou elle le deacutesire dun rocircle uniquement dobservation agrave un rocircle de creacuteation que ce soit dans ses activiteacutes personnelles ou professionnelles Les internautes utilisent le Web 20 sur une base personnelle mais aussi professionnelle dans un cadre public ou priveacute que ce soit pour informer et sinformer (agrave la laquo Web 10 raquo) mais aussi pour collaborer reacuteseauter ou eacutechanger dans le cadre de leurs activiteacutes

Sphegraveres dutilisation du Web 20

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 10: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 10

Dans lunivers du Web 20 on observe que les sphegraveres publique et priveacutee personnelle et professionnelle deviennent permeacuteables leurs frontiegraveres eacutetant plus floues Par exemple certains blogueurs meacutelangent parfois anecdotes personnelles et reacuteflexions lieacutees agrave leur travail sur leurs blogues Le caractegravere priveacute de certaines formes dexpression comme les journaux intimes souvre agrave la sphegravere publique par exemple sur les blogues et les reacuteseaux sociaux

Lutilisation faite des technologies du Web 20 est aussi tributaire du contexte des internautes Une fracture numeacuterique existe toujours pour certaines reacutegions ou certains pays ayant un accegraves limiteacute agrave ces plateformes pour des raisons eacuteconomiques ou sociales Au Queacutebec la population est globalement brancheacutee et active sur les reacuteseaux sociaux comme le montrent les reacutesultats de lenquecircte NETendances du Cefrio

En 2018 la presque totaliteacute des adultes queacutebeacutecois (95 ) deacutetient au moins un des cinq appareils eacutelectroniques suivants ordinateur (portable ou de table) teacuteleacutephone intelligent tablette eacutelectronique bracelet dexercice connecteacute et montre intelligente

(Cefrio 2018 NETendances 2018 Portrait numeacuterique des foyers queacutebeacutecois Volume 9 no 4 p 7 httpscefrioqcca)media2015netendances2018-portraitnumeriquefoyersquebecoispdf

En 2018 83 des adultes queacutebeacutecois utilisaient au moins un reacuteseau social dans le cadre de leur utilisation personnelle dInternet ce qui repreacutesente une hausse notable de 16 points de pourcentage par rapport agrave 2016

(Cefrio 2018 NETendances 2018 Usage des meacutedias sociaux au Queacutebec Volume 9 no 5 p 6 httpscefrioqcca)media2023netendances-2018_medias-sociauxpdf

On retrouve plusieurs initiatives dexploitation des plateformes 20 entre autres au sein des institutions culturelles queacutebeacutecoises

Quelques initiatives queacutebeacutecoises sur le Web 20

Initiatives But(s)

Projets Wiki de BAnQ

httpsfrwikipediaorgwikiWikipeacutediaBAnQ

laquo Ces projets visent agrave mettre en valeur les fonds et les collections de BAnQ agrave rendre disponibles aux wikimeacutediens les ressources numeacuteriseacutees de linstitution et agrave contribuer agrave lenrichissement des articles de Wikipeacutedia (et ses projets fregraveres) concernant le Queacutebec le Canada franccedilais et plus largement lAmeacuterique franccedilaise raquo

Projets Wiki de la Cineacutemathegraveque queacutebeacutecoise

httpsfrwikipediaorgwikiWikipeacutediaCineacutemathegraveque_queacutebeacutecoise

laquo La Cineacutemathegraveque queacutebeacutecoise sinvestit dans la production et la diffusion de connaissances libres sur le cineacutema queacutebeacutecois Depuis septembre 2017 nous organisons notamment des activiteacutes citoyennes dans le but denrichir les projets Wikimeacutedia dans ce domaine raquo

Cafeacute des savoirs libres

Adoption du Web 20 au Queacutebec

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 11: SCI6005 Information numérique et informatique documentaire

11 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

httpswwwsavoirslibresca laquo Le Cafeacute des savoirs libres est un collectif montreacutealais de bibliotheacutecaires enseignants chercheurs et autres passionneacute(e)s qui organise des rencontres de partage des projets et des eacuteveacutenements autour des savoirs libres et des communs numeacuteriques raquo

(Source dinspiration compte-rendu de la confeacuterence-midi du 21 septembre 2017 sur la culture ouverte et le savoir libre par bibliomancienne (Marie D Martel) httpsbibliomanciennecom20170922culture-ouverte-et-savoir-libre-a-lebsi-

)sqil-copibecpasenmonnom

423 Web 30 Le Web seacutemantique

Le World Wide Web Consortium (W3C)deacutefinit le Web seacutemantique ainsi

The Semantic Web provides a common framework that allows data to be shared and reused across application enterprise and community boundaries It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners

( )Source W3C 2013

Lideacutee centrale de ce quils identifient comme un Web de donneacutees est celle dun Web ougrave les documents sont laquo enrichis raquo de maniegravere agrave les rendre compreacutehensibles non seulement aux humains mais aussi aux machines pour en faciliter la

reacuteutilisation Cet enrichissement se fait agrave laide de permettant de deacutecrire diffeacuterents aspects des documents meacutetadonneacutees

(par exemple lauteur la date de creacuteation)

En fait les folksonomies du Web 20 repreacutesentent une couche laquo seacutemantique raquo ajouteacutee aux ressources et illustre certainele potentiel du laquo Web seacutemantique raquo en ce quelles permettent la creacuteation de nouvelles connaissances laquo raquo car certainecest souvent une seacutemantique plus personnelle que collective quon y retrouve comme les eacutetiquettes que lon met agrave des photos sur Flickr par exemple Agrave un certain moment parmi les eacutetiquettes les plus populaires sur Flickr se retrouvait le mot comme plusieurs utilisateurs lemployaient pour les photos ougrave ils se retrouvaientme

Les applications composites ndash ou les ndash que lon retrouve sur le Web 20 deacutemontrent linteacuterecirct du croisement de mashupsdiverses donneacutees Pensons par exemple agrave la possibiliteacute dexplorer les photos deacuteposeacutees sur Flickr agrave laide dune carte (

) La carte creacuteeacutee est le reacutesultat du croisement des eacutetiquettes geacuteographiques apposeacutees par les httpswwwflickrcommaputilisateurs de Flickr agrave leurs photos avec une carte

Cette ideacutee dajouter aux documents du Web une couche seacutemantique pour en faciliter le partage et la reacuteutilisation est attribueacutee agrave Tim Berners-Lee Une des premiegraveres mentions de cette ideacutee lui est attribueacutee lors de lInternational World

en 1994 Le Web seacutemantique est ainsi une extension du Web que lon connaicirct par lajout de cette Wide Web Conferencecouche seacutemantique et le deacuteveloppement de technologies permettant de lexploiter Diffeacuterents standards y sont rattacheacutes

que (2013 p 28) deacutecrivent ainsi Bermegraves et coll

Ainsi le Web seacutemantique a pour objet de fournir des standards qui vont rendre possible ce Web plus intelligent et plus efficace Ces standards incluent le modegravele des outils comme (RDF Schema) et (Web Ontology RDF () RDFS () OWL ()Language) pour deacutecrire la seacutemantique et la logique des donneacutees et aussi des standards pour manipuler et traiter les donneacutees comme le langage et protocole de requecircte de RDFSPARQL ()

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 12: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 12

bullbullbullbullbull

Dans leur ouvrage ces auteurs sinteacuteressent au Web seacutemantique en bibliothegraveque et espegraverent reacuteussir par cet ouvrage agrave mobiliser vos [bibliotheacutecaires] compeacutetences danalyse de linformation et de traitement des donneacutees pour vous [bibliotheacutecaires] montrer comment elles peuvent ecirctre mises en valeur dans le nouvel environnement apporteacute par le Web

seacutemantique (Bermegraves et al 2013 p 13) Comme le preacutecise (2017 p 28) Bermegraves et al dans leur ouvrage Da Sylva

reconnaissent le rocircle des bibliothegraveques dans le Web seacutemantique rocircle en continuiteacute avec leurs missions et leurs activiteacutes traditionnelles Il importe ainsi comme professionnelles et professionnels de linformation den connaicirctre les bases et tout particuliegraverement les types de donneacutees quon y retrouve soit les donneacutees ouvertes lieacutees deacutecrites plus loin dans les notes de cours

Un exemple du Web seacutemantique que lon croise freacutequemment dans nos recherches sur le Web est le Google Knowledge En effet on voit apparaicirctre lors de certaines recherches dans le moteur de recherche Google un encart agrave la droite Graph

de la liste des reacutesultats retourneacutes qui preacutesente des informations souvent factuelles en lien avec la recherche Cest le cas par exemple si vous faites une recherche sur une personnaliteacute connue ou un pays Cet encart est produit par la mise en relation de plusieurs jeux de donneacutees distincts en lien avec lobjet de votre recherche Cest un exemple du potentiel du Web seacutemantique qui permet par la couche seacutemantique ajouteacutee agrave certaines donneacutees de geacuteneacuterer de nouvelles donneacutees (les encarts de ) Plus dinformations sur cette fonctionnaliteacute sont disponibles sur le blogue de Google Knowledge GraphGoogle agrave lURL httpsgoogleblogblogspotcom201205introducing-knowledge-graph-things-nothtml

424 Culture informationnelle et numeacuterique sur le Web

Le Web par les plateformes et services quil propose vient modifier la et des culture numeacuterique informationnelle

internautes Le Web 20 par exemple en facilitant la creacuteation de contenu et la participation amegravene les internautes qui y contribuent agrave deacutevelopper une culture informationnelle baseacutee sur le partage de linformation Certains disent que le Web 20 a ainsi deacutemocratiseacute la creacuteation du contenu une affirmation quil nous semble important de nuancer comme un

existe encore pour certaines populations auquel sajoute une certaine fracture sociale En effet mecircme fosseacute numeacuterique

en ayant accegraves au Web ce ne sont pas tous les internautes qui sont precircts et sont en mesure de participer activement agrave la

creacuteation de contenu proposent une eacutechelle deacutecrivant sept niveaux dinteraction avec le Web Li amp Bernoff (2011)

leacutechelon 1 eacutetant celui avec le moins dinteraction et leacutechelon 7 celui avec linteraction la plus intense

Social Technographics ladder (Li amp Bernoff 2011 p43 notre traduction et repreacutesentation)

Eacutechelon Profil Caracteacuteristiques

7 Creacuteateur Publie un bloguePublie son propre site WebTeacuteleacutecharge des videacuteos quil a creacuteeacutesTeacuteleacutecharge de la musique quil a creacuteeacuteePublie des articles quil a eacutecrit

Exemple Google Knowledge Graph

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 13: SCI6005 Information numérique et informatique documentaire

13 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bull

bullbullbullbullbullbull

bullbull

bullbullbull

bullbullbullbull

bullbull6 Causeur Met agrave jour son statut sur un reacuteseau social

Publie des mises agrave jour sur Twitter

5 Critique Publie des eacutevaluationscritiques de produits ou de servicesCommente sur le blogue dune autre personneContribue agrave des forums en ligneContribue agrave des articles sur un wiki

4 Collectionneur Utilise les fils RSSVote pour des sites WebAjoute des eacutetiquettes agrave des pages Web ou des photos

3 Social Possegravede un profil sur un reacuteseau socialVisite des reacuteseaux sociaux

2 Spectateur Lit des bloguesEacutecoute des baladodiffusionsRegarde des videacuteos dautres utilisateursLit des forums en ligneLit des eacutevaluationscritiques de produitsLit des gazouillis

1 Inactif Aucun des eacuteleacutements preacutesenteacutes ci-dessus

Plusieurs enjeux peuvent ecirctre souleveacutes en lien avec la culture informationnelle et numeacuterique sur le Web dont les quatre suivants

Enjeu 1 Journalisme citoyen

On observe par laccessibiliteacute de plus en plus grande des plateformes Web lapparition dun laquo journalisme citoyen raquo ougrave lindividu impliqueacute dans certains eacuteveacutenements se sert des plateformes sociales pour diffuser ses penseacutees sur lactualiteacute en parallegravele des meacutedias de masse traditionnels Le message ainsi partageacute contourne les filtres potentiels des meacutedias de masse Ceci ne veut toutefois pas dire que linformation ainsi publieacutee est exempte de biais cette forme dauto-publication en labsence de validation transfegravere le rocircle de validation au lecteur qui doit pouvoir distinguer les fausses nouvelles des vraies

Enjeu 2 Reacuteutilisation de linformation

La culture de partage de contenu saccompagne de pratiques de laquo remixage raquo ougrave les internautes utilisent et reacuteutilisent les contenus Cette reacuteutilisation ne se fait pas toujours dans le respect de la proprieacuteteacute intellectuelle et des droits des auteurs Pour certains les lois sur les droits dauteur sont trop restrictives et viennent en contradiction avec cet esprit de partage On a ainsi vu au fil des ans se deacutevelopper des cadres moins restrictifs que les lois sur le droit dauteur afin de faciliter ce laquo remixage raquo et respecter ainsi lesprit du Web 20 Mentionnons agrave cet eacutegard le (gauche dauteur) et les Copyleft

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 14: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 14

autorisations qui permettent aux auteurs daccorder certains droits de reacuteutilisation de leur contenu Creative CommonsNen demeure pas moins que cette eacutevolution des droits dauteur doit agrave notre avis saccompagner dune sensibilisation des internautes sur le respect des droits dauteur

Enjeu 3 et Identiteacute numeacuterique reacuteputation numeacuterique

Un enjeu important reacuteside dans les traces laisseacutees par linternaute sur le Web qui concurrent agrave lui construire une voire des identiteacutes numeacuteriques ce qui nest pas sans conseacutequence Que ce soit volontairement ou non tout internaute laisse sur le Web des traces en commentant des blogues en mettant des photos sur le Web en ayant un profil public sur Facebook traces qui pourront servir agrave la communauteacute pour se faire une opinion sur lui

Cette reacuteputation numeacuterique peut parfois les desservir sils ne sont pas attentifs aux traces quils laissent De nombreuses histoires existent dInternautes nayant pas obtenu un emploi ou ayant perdu leur emploi pour des photos disgracieuses sur le Web ou pour avoir eacutemis une opinion neacutegative sur son employeur sur la place publique Le pheacutenomegravene nest pas nouveau le Web 20 vient simplement lamplifier et le compliquer

Les difficulteacutes proviennent en partie de leacutevolution de la notion de sphegravere publique et de sphegravere priveacutee Certains internautes perccediloivent comme priveacutees certaines plateformes sans se rendre compte que comme elles sont ouvertes linformation qui sy trouve devient publique

Ceci se complique du fait que linformation est facilement repeacuterable et reacutecupeacuterable sur le Web et circule tregraves rapidement Les traces sont presque permanentes Le droit agrave loubli nest pas un droit automatique dans le Web actuel et linternaute qui veut reacutetablir sa reacuteputation numeacuterique na pas la tacircche facile des compagnies offrent mecircme maintenant des services afin deffacer les traces

Agrave lopposeacute la conscience des auditoires multiples quont certains internautes peut les amener agrave deacutevelopper des laquo personnaliteacutes numeacuteriques raquo multiples modulant selon les occasions les traces laisseacutees Un adolescent ayant dans son profil Facebook ses parents comme amis et en eacutetant conscient ndash ce qui nest pas toujours le cas ndash ny interviendra pas de la mecircme maniegravere quun autre inconscient de leur preacutesence ou ne les ayant pas inclus dans son reacuteseau social Un mecircme individu pourrait ainsi avoir plusieurs laquo visages raquo 20 rendant difficile agrave lobservateur exteacuterieur lidentification de sa vraie personnaliteacute

Enjeu 4 Effet geacuteneacuterationnel

Comme dernier enjeu nous pouvons penser aux diffeacuterences geacuteneacuterationnelles qui existent dans lutilisation des meacutedias sociaux Force est de constater comme le montrent certaines eacutetudes sur lutilisation des technologies de linformation que diffeacuterentes geacuteneacuterations utilisent le Web diffeacuteremment En fait ce nest pas uniquement le Web mais les technologies de linformation en geacuteneacuteral Le regard que lon porte sur ces derniegraveres peut entre autres ecirctre influenceacute par notre geacuteneacuteration Par exemple les personnes neacutees avant lapparition de la teacuteleacutephonie mobile auront eu comme premiegravere utilisation des teacuteleacutephones un contexte tregraves priveacute (agrave la maison) les teacuteleacutephones eacutetant fixes Cette conception de lusage dun teacuteleacutephone pourrait se reacuteveacuteler tregraves diffeacuterente pour quelquun nayant connu que la teacuteleacutephonie mobile On retrouve aussi

cette potentielle diffeacuterence de perspective du numeacuterique entre les personnes ( ) et les natives numeacuteriques digital natives

personnes dites ( )immigrantes numeacuteriques digital immigrants

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 15: SCI6005 Information numérique et informatique documentaire

15 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

Se cocirctoieront dans la socieacuteteacute des gens ayant une culture et des pratiques informationnelles diffeacuterentes ainsi que des attentes diversifieacutees Les organisations doivent en prendre conscience et eacutevaluer le meilleur moyen de rejoindre ces diffeacuterences

5 Donneacutees sur le Web

Les professionnels de linformation dans leur pratique aujourdhui doivent consideacuterer non seulement les documents et linformation mais aussi diffeacuterents types de donneacutees Cela aura un impact eacutegalement sur le deacuteveloppement de la discipline des sciences de linformation sur la recherche qui est meneacutee et sur la formation offerte

(Source )Da Sylva 2017 p 30

Comme le fait bien ressortir Da Sylva il est important dun point de vue de la gestion de linformation de sinteacuteresser agrave la question des donneacutees sur le Web On retrouve en effet diffeacuterents types de donneacutees qui demandent aux professionnelles et professionnels de linformation de deacutevelopper des compeacutetences varieacutees entre autres (Da Sylva 2017 p 30)

Pour les des compeacutetences en description des donneacutees ainsi quen eacutevaluation de linformation et donneacutees ouvertesformation des usagersPour les des compeacutetences en description et recherche dinformation donneacutees lieacuteesPour les des compeacutetences principalement en organisation et en organisation mais aussi en donneacutees de recherchearchivistique pour la planification de la gestion des donneacutees

Mais avant toute chose il faut sassurer de bien comprendre ce que sont des donneacutees ouvertes des donneacutees lieacutees et des donneacutees de recherche

La question des diffeacuterents types de donneacutees sur le Web est vaste Lobjectif viseacute dans le cours est de vous introduire agrave ces derniegraveres Ainsi une bregraveve description de ces trois types de donneacutees est preacutesenteacutee dans les sections qui suivent description qui sera compleacuteteacutee par une exploration concregravete des trois types de donneacutees couverts dans le cadre du TP Donneacutees Si la gestion des donneacutees vous inteacuteresse le cours est pour SCI6201 Introduction agrave la gestion des donneacuteesvous

51 Donneacutees ouvertes

Un premier type de donneacutees important agrave connaicirctre comme professionnelle et professionnel de linformation sont les Ladjectif ouvertes rejoint une ideacutee douverture similaire agrave celle des logiciels ouverts soit celle de leur donneacutees ouvertes

accessibiliteacute publique que la deacutefinition ci-dessous fait bien ressortir

Remarque

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 16: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 16

bull

bull

bull

Cest typiquement de linformation surtout sous forme de statistiques chiffriers ou autres formats tabulaires qui provient dun organisme public (mais parfois priveacute) et qui est rendue disponible publiquement sur le Web

(Source p 8)Da Sylva 2017

Il sagit ainsi de jeux de donneacutees produits par des particuliers des organisations des gouvernements par exemple et qui sont mis agrave disposition des internautes publiquement sur le Web Il est ainsi possible de les consulter voire de les reacuteutiliser Parmi les enjeux propres aux donneacutees ouvertes nous retrouvons

Format de donneacutees Le choix du format pour les donneacutees partageacutees est crucial dans une perspective de partage et de reacuteutilisation Certains portails de donneacutees ouvertes comme du Gouvernement du Queacutebec (Donneacutees Queacutebec

) vont prescrire certains formats pour les jeux de donneacutees les principaux eacutetant httpswwwdonneesquebeccafrCSV XML JSON et GeoJSON (httpswwwdonneesquebeccafrfaqles-donnees-recherche-visualisation-

)format-utilisation-et-licenceQualiteacute des donneacutees Sur le portail se trouvent preacuteciseacutes des critegraveres pour eacutevaluer la qualiteacute des jeux Donneacutees Queacutebecde donneacutees en sus du format tel que la licence utiliseacutee pour leur partage (httpswwwdonneesquebeccafrfaq

)les-donnees-recherche-visualisation-format-utilisation-et-licenceLicence pour le partage Afin de favoriser le partage des donneacutees ouvertes il est important dutiliser une licence qui le permet On utilise par exemple sur le portail de la Ville de Montreacuteal la licence Creative Donneacutees OuvertesCommons CC-BY 40 afin de favoriser le partage et lutilisation des donneacutees ouvertes (httpsdonneesmontrealca

)licence-d-utilisation

Vous explorerez plus avant le portail de donneacutees ouvertes dans le cadre du TP DonneacuteesDonneacutees Queacutebec

52 Donneacutees lieacutees

Abordeacutees lorsque le Web seacutemantique a eacuteteacute preacutesenteacute les donneacutees lieacutees sont aussi dinteacuterecirct pour les professionnels et

professionnelles de linformation Il sagit de donneacutees auxquelles ont eacuteteacute associeacutees des afin de rendre meacutetadonneacutees

possible leur manipulation et croisement

Ensemble de donneacutees munies de leurs meacutetadonneacutees qui relieacutees les unes aux autres constituent une base de donneacutees agrave leacutechelle du Web

(Source OQLF Grand dictionnaire terminologique 2013 )httpgdtoqlfgouvqccaficheOqlfaspxId_Fiche=26520043

Comme le deacutemontre la deacutefinition ci-dessous donneacutee par le Gouvernement du Queacutebec les donneacutees lieacutees sont associeacutees agrave certains concepts cleacutes

Donneacutees structureacutees en et publieacutees par un eacutediteur sur le Web en recourant agrave leur pour cibler un contenu donneacute RDF URI

Le principe sous-jacent est de nommer les objets que lon juge inteacuteressants et de les rendre accessibles en indiquant leur URI sur le Web

(Source )Gouvernement du Queacutebec 2020

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 17: SCI6005 Information numérique et informatique documentaire

17 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbullbullbullbullbullbull

1 2 3

4 5

1

2 3

St-Germain (2017 p 36) reacutesume ainsi les cinq niveaux de qualiteacute des donneacutees lieacutees proposeacutes par Berners-Lee en 2010

Les donneacutees sont disponibles sur le Web peu importe leur format agrave laide dune licence ouverte Les donneacutees sont disponibles dans un format de donneacutees structureacutees comme par exemple Excel Les donneacutees sont disponibles dans un format non-proprieacutetaire comme par exemple en format texte deacutelimiteacute par des virgules Les donneacutees sont identifieacutees agrave laide dURI afin que dautres puissent les pointer Les donneacutees sont relieacutees agrave dautres donneacutees pour fournir du contexte

Des donneacutees qui reacutepondent agrave ces cinq critegraveres peuvent ecirctre consideacutereacutees comme des donneacutees lieacutees et ouvertes

Plusieurs auteurs sentendent quant agrave limportance des donneacutees lieacutees en contexte bibliotheacuteconomique (voir par exemple

et ) St-Germain (2017 p 37-38) souligne le gain de visibiliteacute que Bermegraves et al 2013 Da Sylva 2017 St-Germain 2017

ladoption de donneacutees ouvertes et lieacutees peut apporter aux donneacutees des catalogues de bibliothegraveques ainsi que leur enrichissement du fait de pouvoir les lier agrave dautres ressources externes Elle mentionne aussi laugmentation de linteropeacuterabiliteacute des donneacutees par ladoption dun format universel qui facilitera le partage et la reacuteutilisation Plusieurs bibliothegraveques nationales ont commenceacute agrave inteacutegrer des donneacutees ouvertes et lieacutees dont la BnF que vous explorerez dans le cadre du TP Donneacutees

Selon St-Germain (2017 p 40) la place des professionnels de linformation au sein de leacutequipe de deacuteveloppement [de projet de donneacutees ouvertes et lieacutees] est absolument neacutecessaire Les compeacutetences que les bibliotheacutecaires et autres professionnels de linformation doivent mobiliser dans un projet de donneacutees ouvertes et lieacutees touchent trois aspects (Zengenene Casaros amp Meghini 2014 citeacutes dans St-Germain 2017 p 40)

Les systegravemes dinformation comme tels (teacuteleacutechargement installation configuration) et les formats XML et RDF qui y sont utiliseacutes Les meacutetadonneacutees produites lors du catalogageLa modeacutelisation afin decirctre en mesure de comprendre la structure des donneacutees et de pouvoir convertir de maniegravere efficace les donneacutees vers RDF

53 Donneacutees de recherche

Finalement on ne peut passer sous silence les qui sont entre autres le produit du mouvement de donneacutees de recherchela science ouverte La gestion des donneacutees de recherche (GDR) de leur creacuteation jusquagrave leur partage et leur reacuteutilisation

vise plusieurs objectifs ( diapositive 6) Reacuteseau Portage sd

Assurer la production de donneacutees de recherche de grande qualiteacutePermettre une meilleure diffusion de la recherche et en accroicirctre les retombeacuteesRendre la recherche plus efficacePromouvoir lexcellence en rechercheFaire progresser plus rapidement la scienceEacuteviter la duplication de la rechercheFaciliter la reacuteutilisation des donneacutees

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 18: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 18

bull

bull

bull Encourager la collaboration en recherche

De plus certains organismes subventionnaires peuvent exiger des chercheurs et chercheuses qui obtiennent une subvention de mettre en place un plan de gestion des donneacutees de recherche Cest ainsi dans une ideacutee de partager les donneacutees issues de la recherche pour rendre la science plus accessible que le domaine de la GDR sest deacuteveloppeacute Les bibliothegraveques universitaires ont entre autres un rocircle de premier plan en matiegravere de GDR en eacutetant activement impliqueacutees avec la communauteacute de recherche universitaire pour les aider agrave deacutevelopper des plans de gestion des donneacutees de recherche et agrave geacuterer leurs donneacutees de recherche On a ainsi vu apparaicirctre des postes de bibliotheacutecaire agrave la gestion des donneacutees de recherche dans certaines universiteacutes Au Canada l Association des bibliothegraveques de recherche du Canadaa lanceacute le reacuteseau Portage en 2015 afin de coordonner les efforts en matiegravere de GDR ( )httpsportagenetworkcafr

On peut deacutefinir les donneacutees de recherche comme suit

[E]nregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sources principales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacute scientifique comme neacutecessaires pour valider des reacutesultats de recherche Un ensemble de donneacutees de recherche constitue une repreacutesentation systeacutematique et partielle du sujet faisant lobjet de la recherche

(Source p 18)OCDE 2007

On retrouve aussi pour les donneacutees de recherche les enjeux lieacutes aux formats et aux licences pour le partage Les enjeux eacutethiques sont aussi bien preacutesents par rapport aux donneacutees qui sont partageacutees

Vous explorerez un deacutepocirct de donneacutees de recherche dans le cadre du TP Donneacutees

Les concepts de donneacutees ouvertes donneacutees lieacutees et donneacutees de recherche ne sont pas mutuellement exclusifs Des donneacutees lieacutees peuvent ecirctre ouvertes ainsi que des donneacutees de recherche peuvent ecirctre ouvertes

6 Importance de la normalisation

Mateacuteriel adapteacute de Marcoux Yves 2007 Notes de cours du SCI6052 Information documentaire numeacuterique EBSI FAS UdeM

Les preacuteoccupations lieacutees au format preacutesenteacutees lors du deuxiegraveme cours sont aussi preacutesentes dans le contexte du Web Dans ces espaces virtuels des documents numeacuteriques naissent circulent et seacutechangent et on doit se preacuteoccuper

De laccessibiliteacute des documents un document sur le Web doit ecirctre dans un format qui est compris par une communauteacute de lecteurs la plus grande possible De la peacuterenniteacute des documents le document doit demeurer accessible dans le futur

Remarque

Remarque

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 19: SCI6005 Information numérique et informatique documentaire

19 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

bullbull

bull

bull

bull

bullbullbullbullbullbull

bullbullbull

bull De la reacuteutilisabiliteacute des documents on peut reacutecupeacuterer un document archiveacute et continuer agrave travailler dessus pour creacuteer un nouveau document

Ladoption de formats normaliseacutes est un moyen de reacutepondre agrave ces preacuteoccupations Pour la gestion de linformation la normalisation est particuliegraverement cruciale en raison de limportance de laccessibiliteacute la peacuterenniteacute et la reacuteutilisabiliteacute des

documents On y retrouve trois types de pertinentes speacutecifications

Des speacutecifications dun format (par exemple HTML)Des speacutecifications dun protocole (par exemple HTTP)Des proceacutedures pour les humains (par exemple ISO-15489 Records management)

Ces documents normatifs (les laquo speacutecifications raquo elles-mecircmes) sont destineacutes aux humains Ils deacutecrivent un format ou un protocole normaliseacute et indiquent comment deacutevelopper des produits ou systegravemes qui respectent la norme et sont donc laquo interopeacuterables raquo

En gestion de linformation numeacuterique les deux premiers types (formats et protocoles) sont les plus deacuteterminants sur

lefficaciteacute et lefficience des systegravemes automatiseacutes Si on vise la reacuteutilisation de linformation et l il interopeacuterabiliteacute

importe que les systegravemes mis en place respectent des normes pour les formats et les protocoles

Il existe diffeacuterents niveaux de normalisation Une norme officielle (ou ) peut ecirctre deacutefinie sur le plan national ou sur de jurele plan international Les normes nationales salignent aux normes internationales Le tableau qui suit preacutesente quelques exemples dinstances de normalisation et de normes quelles prennent en charge

Normes internationales et nationales

Niveau Normes internationales Normes nationales

Deacutefinition Normes deacutefinies et sanctionneacutees par une instance officielle internationale de normalisation

Normes deacutefinies et sanctionneacutees par un organisme de normalisation national

Exemples dinstances

ISO ( )International Organization for StandardisationW3C ( )World Wide Web ConsortiumUnicode ConsortiumIEEE ( )Institute of Electrical and Electronics EngineersIEC ( )International Electrotechnical CommissionECMA International (European Computer Manufacturers

)AssociationITU ou UIT (Union internationale des teacuteleacutecommunications)

ANSI ( ) American National Standard Institute(Eacutetats-Unis)NISO (National Information Standards

) (Eacutetats-Unis)OrganizationCSA ( )Canadian Standards AssociationSCC ( )Standards Council of Canada

Exemples de normes

SGML HTML XHTML XML (W3C) ASCII (ANSI) Z3950 (NISO)

Niveaux de normalisation

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 20: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 20

bull

bull

bull

bull

Ecirctre une norme officielle ( ) nest pas tout la reconnaissance et ladoption dans la socieacuteteacute sont encore plus de jureimportantes Les speacutecifications normaliseacutees sont plus stables (changent moins vite) que les speacutecifications guideacutees par des inteacuterecircts commerciaux ce qui est inteacuteressant pour le long terme tout particuliegraverement en gestion de linformation

Karl Dubost (citeacute dans ) amegravene des arguments tregraves convaincants quant agrave limportance des normes libres Dumais 2003

et ouvertes et tout particuliegraverement agrave leur impact social

Limpact social agrave mon avis est limpact le plus important des normes libres Ne pas ecirctre prisonnier dune entiteacute commerciale deacutecidant de lavenir de votre information de vos donneacutees Avoir le choix en toutes circonstances la possibiliteacute de changer de faire autrement voilagrave lenjeu des normes libres

Limportance des normes libres et ouvertes est aussi souligneacutee par l OFE (2008)

In conclusion choosing open standards is highly strategic Their benefits and positive impact are debated and seen at the highest decision making levels Interoperability is a major requirement for the ICT sector as societies governments and industry increasingly move towards global collaboration and integration

7 Ressources en lien avec le cours

Mateacuteriel de cours

Notes de cours (cf )sci6005_a2020_c5_notes_cours

Protocole du TP Donneacutees (exploration) [accegraves restreint]

Lectures suggeacutereacutees

DA SYLVA 2017

DUFOUR 2013

DUMAIS 2003

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 21: SCI6005 Information numérique et informatique documentaire

21 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Culture de linformation

[U]n systegraveme de valeurs dattitudes et de comportements de connaissances et daptitudes qui conduisent non seulement agrave un usage intelligent et approprieacute de linformation externe mais surtout agrave contribuer agrave la diffusion et agrave la bonne utilisation de linformation tant externe quinterne (ou produitereconfigureacutee par soi-mecircme) Donc une culture de partage et denrichissement collectif

(Menou M (2008) In Cacaly S Le Coadic Y-F Pomart P-D Sutter E (dir) Culture de linformationDictionnaire de linformation 3e eacuted Paris Armand Colin p 65-67)

Culture numeacuterique

Ensemble de connaissances et de pratiques se rapportant aux nouvelles technologies de linformation et des communications

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2012 httpgdtoqlfgouvqcca - deacutefinition de Culture Montreacuteal 2015)ficheOqlfaspxId_Fiche=26540982

Fosseacute numeacuterique

Eacutecart existant entre les pays deacuteveloppeacutes et les pays en voie de deacuteveloppement en matiegravere daccegraves aux technologies de linformation et de la communication

Notes

Le fosseacute numeacuterique peut exister non seulement entre les pays industrialiseacutes et les pays en deacuteveloppement mais aussi agrave linteacuterieur mecircme de chaque pays Plus ce fosseacute se creuse plus il augmente leacutecart entre les femmes et les hommes entre les riches et les pauvres entre les jeunes et les vieux entre les gens qui savent lire et eacutecrire et les analphabegravetes et entre les populations urbaines et les populations rurales

Le fosseacute numeacuterique est associeacute notamment agrave laggravation des ineacutegaliteacutes deacutequipement en ordinateur personnel et Internet et aux dispariteacutes croissantes selon le niveau de revenu la localisation geacuteographique et lappartenance ethnique

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2005 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8360705

Identiteacute numeacuterique

Ensemble des traces numeacuteriques laisseacutees de maniegravere active par une personne dans Internet et qui fournissent des renseignements agrave son sujet

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508663

Interopeacuterabiliteacute

Glossaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 22: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 22

Capaciteacute que possegravedent des systegravemes informatiques heacuteteacuterogegravenes agrave fonctionner conjointement gracircce agrave lutilisation de langages et de protocoles communs et agrave donner accegraves agrave leurs ressources de faccedilon reacuteciproque

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2007 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8395687

Meacutetadonneacutees

Une meacutetadonneacutee est agrave proprement parler une donneacutee agrave propos de donneacutees (le preacutefixe grec meta indiquant lautoreacutefeacuterence) En documentation une meacutetadonneacutee est une donneacutee servant agrave deacutefinir ou deacutecrire dautres donneacutees (par exemple un document) La valeur seacutemantique dune meacutetadonneacutee est geacuteneacuteralement deacutecrite et deacutefinie dans un scheacutema de meacutetadonneacutees Agrave titre dexemple une date associeacutee agrave un document est une meacutetadonneacutee servant agrave deacuteterminer la date de publication de deacutepocirct leacutegal de copyright de creacuteation de derniegravere modification etc Les meacutetadonneacutees peuvent ecirctre de nature descriptive structurelle ou administrative (Arsenault Cleacutement

)Terminologie en sciences de linformation - EBSI Meacutetadonneacutees (Metadata)

Natif numeacuterique

Personne neacutee apregraves 1974 qui a grandi dans un monde numeacuterique qui est familiegravere avec les ordinateurs les jeux videacuteo et Internet et qui passe une grande partie de sa vie en ligne

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358516

Natif numeacuterique

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 23: SCI6005 Information numérique et informatique documentaire

23 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Personne neacutee avant 1974 qui na pas grandi dans un monde numeacuterique mais qui a appris agrave sadapter agrave ce nouvel environnement en inteacutegrant lordinateur et les nouvelles technologies agrave sa faccedilon de travailler

Note

On considegravere que les natifs numeacuteriques ont une connaissance de linformatique et des nouvelles technologies (le langage du numeacuterique) comme si ceacutetait leur langue maternelle (donc ils la parlent sans accent) alors que les immigrants numeacuteriques ont une connaissance de celles-ci comme sils parlaient une langue seconde (tels des immigrants parlant une autre langue que la leur mais avec un accent) Chez ces derniers qui ont un pied dans le passeacute (celui davant linformatique) cet accent tel celui dun immigrant est maintenu agrave travers certains de leurs comportements par exemple imprimer leurs courriels

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2004 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=8358524

RDF (Resource Description Framework)

Resource Description Framework est un modegravele de graphe destineacute agrave deacutecrire formellement les ressources Web et leurs meacutetadonneacutees afin de permettre le traitement automatique de telles descriptions

(Source Wikipeacutedia Francophone 2020 )httpsfrwikipediaorgwikiResource_Description_Framework

Reacuteputation numeacuterique

Reacuteputation baseacutee sur la perception que des internautes ont du double numeacuterique dune personne

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2017 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26508673

Speacutecification

Une laquo speacutecification raquo est la description dun ensemble de regravegles etou faccedilons de faire conventionnelles

URI (Uniform Resource Identifier)

Chaicircne de caractegraveres agrave syntaxe normaliseacutee qui sert agrave deacutesigner de faccedilon unique et permanente une ressource par sa localisation ou par son nom

(Office Queacutebeacutecois de la Langue Franccedilaise Grand dictionnaire terminologique 2013 httpgdtoqlfgouvqcca)ficheOqlfaspxId_Fiche=26520166

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 24: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 24

BERMEgraveS Emmanuelle ISAAC Antoine (coll) POUPEAU Gautier (coll) Le Web seacutemantique en bibliothegravequeParis Eacuteditions du Cercle de la Librairie 2013

BUSH Vannevar 176(1) 112-114 As We May Think The Atlantic Monthly 1945 httpswwwtheatlanticcommagazinearchive194507as-we-may-think303881

DA SYLVA Lyne Les donneacutees et leurs impacts theacuteoriques et pratiques sur les professionnels de linformationDocumentation et bibliothegraveques 63(4) 5-34 2017 httpswwweruditorgfrrevues documentation2017-v63-n4-documentation032901042308ar

DUFOUR Christine CADIEUX Steacutephanie Archives 45(1) Web 20 et milieux documentaires quen retenir 27-46 2013-2014 httpswwwarchivistesqccarevuearchivesvol45_145_1_dufour_cadieuxpdf

DUMAIS Michel Le Devoir Technologie Les normes libres lenjeu du moment juillet 2003 httpwwwledevoircomsocietescience-et-technologie32207technologie-les-normes-libres-l-enjeu-du-moment

HERN Alex Worlds most delayed software released after 54 years of development The Guardian 6 juin 2014httpswwwtheguardiancomtechnology2014jun06vapourware-software-54-years-xanadu-ted-nelson-chapman

LANKES R David Joanne SILVERSTEIN NICHOLSON Scott Participatory Networks The Library as Information Technology and Libraries 26(4) 17-33 Conversation 2007 httpsejournalsbceduindexphpital

articleview3267

LI Charlene BERNOFF Josh Boston Groundswell Winning in a world transformed by social technologies Harvard Business Press 2011

MAIGNIEN Yannick IN Pratiques de leacutedition numeacuterique [en ligne] Chapitre 5 Les enjeux du web seacutemantiquep 77-93 Montreacuteal Presses de lUniversiteacute de Montreacuteal 2014 httpbooksopeneditionorgpum320

OLEARY Timothy OLEARY Linda I OLEARY Daniel A New-York Computing Essentials 2019 McGraw-Hill Higher Education 2019

OPENFORUM EUROPE (OFE) OFE Onepage Brief (1) The Importance of Open Standards in Interoperability 2008-10-31 httparchiveopenforumeuropeorglibraryonepage-briefsofe-open-standards-onepage-2008pdf

at_downloadfile

Bibliographie

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 25: SCI6005 Information numérique et informatique documentaire

25 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

ST-GERMAIN Marielle Eacutetapes pour le deacuteveloppement dun projet de donneacutees ouvertes et lieacutees en bibliothegravequeDocumentation et Bibliothegraveques 63(4) 35-45 2017 httpswwweruditorgfrrevuesdocumentation2017-v63-n4-documentation032901042309arpdf

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 26: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 26

GOUVERNEMENT DU QUEacuteBEC Fiche du terme - Donneacutees lieacutees Theacutesaurus de lactiviteacute gouvernementale 2020 httpwww thesaurusgouvqccatagtermedoid=MDL451

LEINER Barry M CERF Vinton G CLARK David D Kahn Robert E KLEINROCK Leonard LYNCH Daniel C POSTEL Jon ROBERTS Larry G WOLFF Stephen Brief History of the Internet 1997 httpswwwinternetsocietyorginternethistory-internetbrief-history-internet

ORGANISATION DE COOPEacuteRATION ET DE DEacuteVELOPPEMENT EacuteCONOMIQUES (OCDE) Principes et lignes directrices pour laccegraves aux donneacutees de la recherche financeacutee sur fonds publics 2007 httpww woecdorgfrsti

inno38500823pdf

REacuteSEAU PORTAGE Gestion des donneacutees de recherche (GDR) 101 Module 1 Contexte et objectifs dapprentissage sd httpsportagenetworkcafrressources-de-formation-par-portagegestion-des-donnees-de-

recherche-gdr-101

WORLD WIDE WEB CONSORTIUM (W3C) W3C Semantic Web activity homepage 2013 httpswwww3org2001sw

Webographie

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 27: SCI6005 Information numérique et informatique documentaire

27 SCI6005 (A2020) Christine Dufour (EBSI UdeM)

Accessibiliteacutep 18

culture informationnellep 4

culture numeacuteriquep 4

Donneacutees de recherchep 15

Donneacutees lieacuteesp 15

Donneacutees ouvertesp 15

Internetp 4

Normalisationp 18

Peacuterenniteacutep 18

Ressources en lien avec le coursp 20

Reacuteutilisabiliteacutep 18

Webp 4

Web 20 Web socialp 4

Web 30 Web seacutemantiquep 4

Index

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources
Page 28: SCI6005 Information numérique et informatique documentaire

SCI6005 (A2020) Christine Dufour (EBSI UdeM) 28

p 3

httpcreativecommonsorglicensespublicdomain40fr johnny_automatic

p 4

httpcreativecommonsorglicensespublicdomain40fr maoriveros

Creacutedits des ressources

  • Cours 5 - Environnements en reacuteseau Internet et Web
    • + Au programme aujourdhui
    • + Alignement peacutedagogique
    • Introduction
    • Eacutevolution dInternet et du Web
      • Internet
      • Web
        • Donneacutees sur le Web
          • Donneacutees ouvertes
          • Donneacutees lieacutees
          • Donneacutees de recherche
            • Importance de la normalisation
            • Ressources en lien avec le cours
              • Glossaire
              • Bibliographie
              • Webographie
              • Index
              • Creacutedits des ressources