Compte-rendu Journées d'études statistiques couperin 23 03 2012

Preview:

DESCRIPTION

Compte-rendu de la journée d'étude sur les statistiques d'utilisation des ressources électroniques organisée par Couperin le 23/03/2012.

Citation preview

STATISTIQUES D’UTILISATION DES RESSOURCES ÉLECTRONIQUES

JOURNÉE D’ÉTUDE COUPERIN, 23/03/2012

ANNE-CHRISTINE GIRARD, SERVICE D'INGÉNIERIE DOCUMENTAIRE SCD UNIVERSITÉ D'AIX-MARSEILLE

Statistiques de consultation des ressources électroniques , quelle réalité dans les BU ?

Enquête menée par Couperin en 2011 auprès de ses membres

Fort taux de participation : 60%

94% des répondants recueillent des statistiques

Revues : 93% recueillent JR1

BDD : 95,8% le DR1

Ebooks : 57% le BR1

62% : au moment de l’ESGBU et des rapports d'activité

51% plusieurs fois par an et presque autant 1 fois/an

But de l'exercice : rendre des comptes

93% : pour justifier des dépenses

Pour l’Esgbu, la gestion des abonnements, la communication, la comparaison (p/r autres établissements), la veille sur téléchargements abusifs, la formation.

20/04/2012

2

Statistiques de consultation des ressources électroniques , quelle réalité dans les BU ?

Recueil des données : émiettement des tâches et du temps

• 22 interfaces en moyenne (jusqu'à 72 !)

• bouquets (96%), titres isolés (53%)

• sur 70% des ressources

• non automatisé à 87%

Difficultés récurrentes

Recueil :

• connexions à la plateforme

• formats des fichiers

• multiplicité des interfaces et gestion des mots de passe

• activité chronophage

Analyse :

• manque de compétence pour analyser les données

• manque de fiabilité des données

• difficultés à comparer les bouquets

• difficultés des analyses par discipline

20/04/2012

3

Statistiques de consultation des ressources électroniques , quelle réalité dans les BU ?

Traitement des données ?

Oui : 82%

97% avec des tableurs

Enrichir les données ?

Oui à 79%

84% avec des données financières

environ 50% avec publics et effectifs

Comparaison des données entre éditeurs ?

68% oui

72% données brutes (et pas des ratios)

20/04/2012

4

Statistiques de consultation des ressources électroniques , quelle réalité dans les BU ?

Synthèses et recommandations :

• isolement des personnels

• manque de temps

• manque de formation

• manque de communication

• manque d'outils

• manque de gouvernance

20/04/2012

5

JUF (Journal Usage Factor)

Projet de recherche COUNTER

Phase de test 2011-2012

• Pour étudier comment les statistiques d'utilisation en ligne pourraient constituer une nouvelle mesure de l'impact et de la qualité d'une revue

• Pour compléter l’Impact Factor

• Disponible pour de nombreux journaux

• Couverture : toutes les disciplines des journaux électroniques

• Immédiateté des rapports

20/04/2012

6

Projet de portail COUPERIN pour le recueil, l'archivage et le traitement des statistiques d'usage

Sur le modèle du JUSP (Journal Usage Statistics Portal) : portail anglosaxon.

Moissonne automatiquement via SUSHI, agrège et présente pour ses membres les statistiques JR1 et JR1a par éditeurs

Projet MESURE : mutualisation et évaluation des statistiques d'utilisation des ressources électroniques

Portail :

• collecte automatique des statistiques d’usage éditeurs

• archivage depuis 2009

• point d'accès unique pour les membres

• quelques indicateurs simples

Phase de prototypage Bientôt : mise en ligne pour les 5 établissements pilotes (Bordeaux 1, Lorraine, Paris 5 Descartes, Rennes 1, Toulouse 3)3 éditeurs : Elsevier, Springer, IOP

Nouveau client SUSHI pour ACS en cours de développement

20/04/2012

7

La production de statistiques locales au moyen de l'analyse des logs d'un reverse proxy : l'expérience de l'Inist et le projet nancéien

Récupération mensuelle des chiffres éditeurs :

• collecte manuelle (45 plateformes, 4 SUSHI)

• dépendance vis à vis des mises à jour des éditeurs

• offre de données hétérogènes

• statistiques incomplètes

• information sur les ressources limitées

• pas d'information sur les unités CNRS qui consultent (1 IP/portail)

Création GT en 2006 : pour exploiter les logs d’un reverse-proxy

Avantages :

• données riches et homogènes

• disponibles pour tous les éditeurs

• rapidité des mises à disposition (journal des logs quotidien)

20/04/2012

8

La production de statistiques locales au moyen de l'analyse des logs d'un reverse proxy : l'expérience de l'Inist et le projet nancéien

Analyse des logs Ezproxy :

• une identification par laboratoire

• un parseur/plateforme (une trentaine)

• transactions de certaines plateformes pas exploitables

• stockage des fichiers journaux dans une bdd : num_stat

Statistiques locales :

• identification de l'utilisateur

• transaction datée (cf. téléchargements abusifs)

• traitements particuliers

• résultats vérifiés (comptage des consultations en interne et comparaison avec les statistiques produites)

• détection des anomalies

Statistiques locales complétées par celles des éditeurs.

Enrichissement des données recueillies : tarifs, disciplines, langues.

20/04/2012

9

La production de statistiques locales au moyen de l'analyse des logs d'un reverse proxy : l'expérience de l'Inist et le projet nancéien

Depuis 2011 : collaboration Université de Lorraine et Inist-CNRS, pour analyser les logs.

Objectifs :

• disposer statistiques locales à comparer avec celles fournies par les éditeurs et pour les bases qui n'en ont pas

• développer de nouveaux parseurs

• partager la maintenance

26 ressources communes Université de Lorraine/Inist

Phase de test

20/04/2012

10

Recommended