46
1 L’internet des sciences humaines et sociales Recherches - Perspectives Véronique Ginouvès http://phonotheque.hypotheses.org

L’internet des sciences humaines et sociales. Recherches - Perspectives

Embed Size (px)

DESCRIPTION

Cours à la demande du GeFem [Genre, Femmes, Méditerranée], le 17 novembre 2011, MMSH.

Citation preview

Page 1: L’internet des sciences humaines et sociales. Recherches - Perspectives

1

L’internet des sciences humaines

et socialesRecherches - Perspectives

Véronique Ginouvès http://phonotheque.hypotheses.org

Page 2: L’internet des sciences humaines et sociales. Recherches - Perspectives

2

Internet et les SHS, 3 questions

1. Comment mettre en place une stratégie de recherche sur internet ?

2. Comment mettre en place une stratégie d’ego référencement ?

3. Comment citer et être cité correctement sur le web ?

Page 3: L’internet des sciences humaines et sociales. Recherches - Perspectives

Mettre en place une stratégie de recherche sur le Web pour les SHS

Différencier les moteurs, des banques de données ou des répertoires – le libre accès des bases payantes ;

Connaître la syntaxe des équations de recherche : elle est différente selon les moteurs mais aussi les catalogues de bibliothèque ;

3

Page 4: L’internet des sciences humaines et sociales. Recherches - Perspectives

Mettre en place une stratégie de recherche sur le Web pour les SHS

Comprendre l’architecture d’une base de données pour une exploitation optimum (ex : index, thésaurus, RAMEAU... ) ;

Savoir que ne pas avoir de résultat ne signifie pas qu’il n’existe pas ou évaluer la part du web invisible ;

Connaître les outils de veille (alertes, réseaux sociaux, blogs, syndication de contenu).

4

Page 5: L’internet des sciences humaines et sociales. Recherches - Perspectives

5

Des repères pour s’adapter

Distinguer au moment de la recherche -les univers fermés (les catalogues de bibliothèque, les sites spécialisés…)-les univers infinis (web, courriel, forums…)Revenir aux sources documentaires classiques car tout ne se trouve pas sur la toile…

Page 6: L’internet des sciences humaines et sociales. Recherches - Perspectives

6

La loi de Mooers

"Un système d’information ne sera pas utilisé tant qu'il apparaîtra à l'utilisateur plus pénible d’obtenir l'information grâce à ce système que de ne pas l'avoir." Mooers ajoutera "Il est de mon opinion que beaucoup d'utilisateurs pourraient ne pas vouloir d'information et qu'ils éviterons d'utiliser un système précisément parce qu'il leur donne de l'information... Obtenir de l'information est douloureux et troublant." Référence : Peter Morville, Ambient findability (O'Reilly Media, Inc., 2005), http://oreilly.com/catalog/9780596007652 p. 44

Page 7: L’internet des sciences humaines et sociales. Recherches - Perspectives

7

Vous êtes des êtres sociaux, il en va de même pour l'information

« Derrière la plupart des sites Web, intranet et produits interactifs ratés, se cache une compréhension ratée des utilisateurs et de leur comportement dans la recherche d'information. Les utilisateurs sont complexes. L'utilisateur est un être social, l'information est aussi de nature sociale »

Référence : Peter Morville, Ambient findability (O'Reilly Media, Inc., 2005), http://oreilly.com/catalog/9780596007652 p. 45

Page 8: L’internet des sciences humaines et sociales. Recherches - Perspectives

Une astuce : interroger ce que l’on connait

Interrogation du catalogue de la bibliothèque de la médiathèque de la MMSH :http://mediabase.mmsh.univ-aix.fr

8

Page 9: L’internet des sciences humaines et sociales. Recherches - Perspectives

9

Les moteurs

Un moteur visite périodiquement une partie des fichiers statiques accessibles sur Internet et met à jour un index comprenant tout ou partie des mots des fichiers visités. Le résultat est une liste de pages web. Un moteur donne une image du Web déjà obsolète car il peut y avoir parfois des décalages importants entre ce que le moteur a « aspiré » et la forme actuelle du site.

Page 10: L’internet des sciences humaines et sociales. Recherches - Perspectives

10

Page 11: L’internet des sciences humaines et sociales. Recherches - Perspectives

11

Page 12: L’internet des sciences humaines et sociales. Recherches - Perspectives

12

La pertinence des résultats : un algorithme nommé Panda

Le nombre de liens qui pointent vers la page ;La qualité du code en particulier la balise html <title>Titre de la page</title> ;Les mots clés contenu dans l’URL ex : www.femmes-emploi.fr ;La fréquence de mise à jour du site (35% des requêtes prend en compte ce critère) ;Détection automatique de sites dits « officiels » ;Le nombre de requêtes faites à travers le moteur ;

Page 13: L’internet des sciences humaines et sociales. Recherches - Perspectives

La pertinence des résultats : un algorithme nommé Panda

Il y en a d’autres moins faciles à percevoir comme la traduction automatique des résultats lorsqu'une requête est demandée dans une langue et renvoie à trop peu de résultats ;

Et d’autres encore, …c’est le mariage de tous ces critères qui permet le calcul de pertinence de Google, véritable secret industriel, constamment modifié (jusqu’à 500 fois par) pour lutter contre le spamindexing.

13

Page 14: L’internet des sciences humaines et sociales. Recherches - Perspectives

14

Prédominance de Google

Google représente 91,6 % du trafic généré par les moteurs de recherche francophones

AT Internet Institute, mars 2011

Plus de la moitié des recherches Google proviennent de pays autres que les États-Unis.(Données internes à Google)

Carte du monde de l'utilisation de Google

Page 15: L’internet des sciences humaines et sociales. Recherches - Perspectives

15

Relativiser les modes de recherche

Sur Google 34% des internautes se contentent de requêtes en un mot,

30% en 2 mots, 18% en 3 mots

Source : http://www.journaldunet.com/chiffres-cles.shtml (Journal du net, décembre 2010)

Page 16: L’internet des sciences humaines et sociales. Recherches - Perspectives

16

Relativiser les modes de recherche

42% des utilisateurs cliquent uniquement sur le premier résultat de la recherche.

8% cliquent ensuite sur le deuxième résultat.

Source : http://www.useit.com/alertbox/defaults.html

Page 17: L’internet des sciences humaines et sociales. Recherches - Perspectives

17

Relativiser l’emploi des langues sur l’internet

Page 18: L’internet des sciences humaines et sociales. Recherches - Perspectives

18

Les moteurs spécialisés

Google Scholar, depuis novembre 2004

Scirus - For scientific information, depuis 2001

Isidore - Accès aux données numériques des SHS, depuis 2010

In-Extenso créé en 2002, arrêté en 2009

OAIster créé 2002, devenu le moteur d'OCLC en octobre 2009

Page 19: L’internet des sciences humaines et sociales. Recherches - Perspectives

19

Google Scholar

Moteur de recherche spécialisé dans la littérature universitaire lancé fin 2004, encore en version beta en septembre 2011.

Base de données pluridisciplinaire

http://scholar.google.com/

Page 20: L’internet des sciences humaines et sociales. Recherches - Perspectives

20

Qu’interroger sur Google Scholar ?

La couverture de Google Scholar ne peut pas être définie avec précision. L’objectif est de retrouver les documents du monde scientifique. La base de données est multidisciplinaire avec une prépondérance des ressources en sciences exactes et médicales.

Page 21: L’internet des sciences humaines et sociales. Recherches - Perspectives

21

Dans Google Scholar vous y trouvez …

- Des fichiers en texte intégral à accès libre et payants en format HTML et PDF : éditeurs scientifiques, sociétés savantes,

répertoires de pre-prints, serveurs universitaires... - Des articles avec évaluation par les

pairs (peer reviewed), des thèses, des livres, des articles en pré-publication, des rapports…

Google Scholar ne fournit aucune liste des éditeurs commerciaux ni de liste des serveurs d’archives qu’il indexe.

Page 22: L’internet des sciences humaines et sociales. Recherches - Perspectives

22

Vous ne savez rien sur…

La période couverte par ces documentsLe volume des documents présents sur Google ScholarLes langues représentées même si l’anglais est prédominant.La mise à jour des informations.

Page 23: L’internet des sciences humaines et sociales. Recherches - Perspectives

23

Scirus

• Scirus est un moteur de recherche scientifique pluridisciplinaire développé par l’éditeur scientifique Elsevier

• Son « Advisory board » est composé de chercheurs et de professionnels de l’information

• Scirus annonce l’indexation de plus de 410 millions de pages issues du web scientifiques (Septembre 2011)

http://www.scirus.com

Page 24: L’internet des sciences humaines et sociales. Recherches - Perspectives

24

Scirus vous explique son fonctionnement

Scirus indexe le texte intégral des pages Web qu’il visite.

• Les ressources obtenues suites à vos interrogations sont toutes accessibles depuis le Web, mais un certain nombre seront d’accès payant (Lexis Nexis, Science Direct d’Elsevier... )

• Vous interrogez dans Scirus aussi bien le texte intégral d’articles de recherches que le texte de sites d’informations institutionnels (plaquettes de laboratoire en ligne, sites d’universités)

Page 25: L’internet des sciences humaines et sociales. Recherches - Perspectives

25

Scirus vous explique son fonctionnement, mais :

• La politique d’indexation et sa fréquence sont clairement annoncées

• La nature commerciale du moteur tend à mettre en avant les ressources issues des portails payants

• Malgré la volonté annoncée de créer un moteur scientifique vous y trouvez un certain nombre de pages non scientifiques (pages de sites personnels ou commerciaux).

Page 26: L’internet des sciences humaines et sociales. Recherches - Perspectives

26

Isidore - Accès aux données numériques en SHS

Isidore est une plateforme de recherche qui s'appuie sur les principes du web de données et donne accès à des données en accès libre (open access).

En septembre 2011 Isidore donnait accès à 1151 sources de données numériques, regroupées en 49 collections.

http://www.rechercheisidore.fr

Page 27: L’internet des sciences humaines et sociales. Recherches - Perspectives

27

Le « Web de données » comment ça marche ?

Moissonnage ciblé des métadonnées et données scientifiques structurées ;

Indexation des données (non structurées et structurées ;

Normalisation et enrichissement des métadonnées à partir de référentiels reconnus dans la communauté ;

Interface graphique de recherche ;Mise à disposition des métadonnées

enrichies par le moteur.

Page 28: L’internet des sciences humaines et sociales. Recherches - Perspectives

28

Des outils spécialisés : blogs et annuaires

Aldébaranhttp://aldebaran.revues.org

Internet per gli umanisti http://biblio.lett.unitn.it

La boîte à outil des historienshttp://www.boiteaoutils.info/

Les aspects concrets de la thèsehttp://act.hypotheses.org/

Page 29: L’internet des sciences humaines et sociales. Recherches - Perspectives

29

Les bases de données - 1

Chaque base donne des informations en fonction de son principe de fonctionnement

Le catalogue SUDOC fournit :- Des notices bibliographiques (9 millions) ;- La localisation des ouvrages sur 2000 établissements ; - Le PEB avec les bibliothèques adhérentes au réseau.

Page 30: L’internet des sciences humaines et sociales. Recherches - Perspectives

30

Les bases de données - 2

Le catalogue Worldcat, est l'une des bases de données de l'OCLC (Online Computer Library Center) créé en 1971 : vous accédez aux catalogues de plus de 10 000 bibliothèques à travers le monde proposant 1,5 milliards de documents en 31 langues (chiffres 2011). http://www.worldcat.org

Page 31: L’internet des sciences humaines et sociales. Recherches - Perspectives

31

Les bases de données - 3

Les points forts de Worldcat :- La création de bibliographies, publiques ou non, exportables vers des logiciels (EndNote, Refworks, Zotero) ;- L'intégration du portail OAISTER en octobre 2009 pour accéder à des documents numériques ;- L'accès à un index auteur original : Worldcat indentities.

Page 32: L’internet des sciences humaines et sociales. Recherches - Perspectives

32

Les bases de données - 4

Deux bases à accès réservé :

Université de Provence : ENTenvironnement numérique de travailhttp://entu1.phocean.fr/uPortal/

render.userLayoutRootNode.uP

Biblio SHS http://biblioshs.inist.fr/

Page 33: L’internet des sciences humaines et sociales. Recherches - Perspectives

33

Le libre accès, qu'est-ce que c'est ?- Visibilité et accessibilité à la

recherche- Mise à disposition gratuite des

publications scientifiques- Des dispositifs techniques de

stockage et de partage des informations

- Un mouvement international structuré - Le libre accès ne concerne pas

seulement la recherche (ex : Data.gov http://www.data.gov).

Page 34: L’internet des sciences humaines et sociales. Recherches - Perspectives

34

OAI

L’Open Archive Initiative, créée par la convention de Santa Fé (Nouveau Mexique) en 1999, pour : - développer et de promouvoir des standards interopérables pour les bases d’articles scientifiques ; - définir un ensemble de protocoles techniques pour la description des données et leur interrogation ; - oeuvrer pour que la constitution d’archives électroniques devienne un processus établi dans la communication scientifique.

Page 35: L’internet des sciences humaines et sociales. Recherches - Perspectives

35

Le dépôt dans HAL-SHS

L'auteur peut déposer la version "manuscrite" de son document :AVANT publication : il est détenteur des droits sur son texteAPRES publication SOUS contrat :- Sauf interdiction explicitement précisée dans le contrat, l’auteur a le droit de diffuser son document dans une archive institutionnelle électronique. - En cas de clause explicite autorisant l’exploitation électronique du document par l’éditeur : l’auteur doit demander l’autorisation de dépôt à l’éditeur. APRES publication SANS contrat L’auteur a le droit de diffuser son document (version preprint).Les questions de droits des images contenues dans le texte doivent être réglées par l’auteur

Page 36: L’internet des sciences humaines et sociales. Recherches - Perspectives

36

Accès aux articles en SHS

- Revues.org : http://www.revues.org

- Persée : http://www.persee.fr- Cairn : http://www.cairn.info- Erudit :

http://www.erudit.org/revue- HAL SHS :

http://halshs.ccsd.cnrs.fr

Page 37: L’internet des sciences humaines et sociales. Recherches - Perspectives

37

Le web invisible

Page 38: L’internet des sciences humaines et sociales. Recherches - Perspectives

38

Les 4 types de web invisible

-The Opaque Web : les pages qui pourraient être indexées par les moteurs mais qui ne le sont pas (limitation d'indexation du nombre de pages d'un site, fréquence d'indexation, liens absents vers des pages, limite décidée par le moteur…)- The Private Web : les pages web volontairement exclues par les webmasters.- The Proprietary web : pages seulement accessibles pour les personnes qui s'identifient. Le robot ne peut pas toujours y accéder.- The Truly Invisible Web : contenu qui ne peut être indexé pour des raisons techniques, comme un format inconnu par le moteur (même si Google reconnaît la majorité des formats) et surtout de nombreuses des bases de données.

Source : Chris Sherman et Gary Price, The Invisible Web : Finding Hidden Internet Resources Search Engines Can't See

Page 39: L’internet des sciences humaines et sociales. Recherches - Perspectives

L’egoréférencement ou de la nécessité de maîtriser son identité numérique*

1. Faites le choix du libre accès

2. Entrez dans l’économie de l’attention

3. Entrez dans la conversation scientifique

4. Ne laissez personne définir pour vous votre identité numérique

* Repris de Marin Dacos, source : Blogonumericus.

39

Page 40: L’internet des sciences humaines et sociales. Recherches - Perspectives

Faites le choix du libre accès

Les revues en accès restreint font partie du web invisible. Elles ne contribuent pas à votre identité numérique. Par ailleurs, elles contribuent bien faiblement à la marche de la science, parce qu’elles misent sur l’invisibilité en lieu et place de la mise en public. Or, la publication est bien la mise en visibilité, pas la mise au secret

40

Page 41: L’internet des sciences humaines et sociales. Recherches - Perspectives

Entrez dans l’économie de l’attention

Prenez conscience que vous entrez dans une économie de l’attention, sous le sceau de la prolifération documentaire.

Nous avons quitté le paradigme de la rareté. Autrefois, les lecteurs cherchaient les articles. Aujourd’hui, les articles cherchent les lecteurs. Il y a plus de documents en ligne que d’habitants sur cette planète.

41

Page 42: L’internet des sciences humaines et sociales. Recherches - Perspectives

Entrez dans la conversation scientifique

La science moderne est née grâce à la correspondance entre savants. Ces correspondances ont donné les revues. La science moderne est aussi faite de disputatio, le débat entre chercheurs, qui a donné le séminaire. Aujourd’hui, le numérique introduit la notion de séminaire virtuel permanent. Il s’agit d’une conversation scientifique qui se joue des contraintes de temps et d’espace.

42

Page 43: L’internet des sciences humaines et sociales. Recherches - Perspectives

Hypotheses.org ou la nouvelle conversation scientifiqueFemmes au travail, question de genrehttp://fht.hypotheses.org/1797

Devenir historien-nehttp://devhist.hypotheses.org/

Efigies, Etudes Féministes, Genre et Sexualité

http://efigies-ateliers.hypotheses.org

43

Page 44: L’internet des sciences humaines et sociales. Recherches - Perspectives

Ne laissez personne définir pour vous votre identité numérique

Utilisez des outils qui vous permettent de regrouper dynamiquement l’ensemble des informations, vous concernant, que vous souhaitez agréger autour de votre identité numérique :- vos articles sur HAL SHS- vos billets sur Hypotheses.org- votre bibliographie sur Zotero- vos images sur MediHal- vos cours sur Slideshare- vos colloques sur Calenda…

44

Page 45: L’internet des sciences humaines et sociales. Recherches - Perspectives

45

Les nouvelles lois de la citabilité

Le DOI qu’est-ce que c’est ?http://www.doi.org/

Citer une référence électroniquehttp://aldebaran.revues.org/69

Utiliser Zoterohttp://phonotheque.hypotheses.org/5341

Page 46: L’internet des sciences humaines et sociales. Recherches - Perspectives

46

Bonnes recherches...

N'hésitez pas à contacter les professionnels de la bibliothèque à la médiathèque de la [email protected]

Mon courriel : [email protected]