Upload
lhostis
View
703
Download
2
Embed Size (px)
DESCRIPTION
Présentation de GoPubmed
Citation preview
INRA form@doc 2009 - D. L'Hostis -Décembre 2009
Interroger Pubmed différemment :
GoPubmed www.gopubmed.com
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
GoPubmed Introduction - 1
GoPubMed est un outil qui, en plus de retourner exactement les mêmes résultats que PubMed lors d’une recherche, exploite différents systèmes de classification sémantique (thésaurus MESH; Gene Ontology …) pour développer des analyses statistiques des résultats, accessibles de façon très conviviale à l’utilisateur.
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
GoPubmed Introduction - 2
Les résultats de recherche sont :triés selon un vocabulaire contrôlé issu du GO (Gene Ontology) du MeSH (Medical Subject Headings) et Universal ProteinResource ( UniProt). analysés et clustérisés via un système de recherche complémentaire aux mots clés selon 4 filtres prédéfinis :
What est un regroupement thématique,When un filtre sur la date,Who et Where permettent en quelques clics de cerner un auteur. Le système est potentiellement capable de distinguer les homonymes et de retracer plusieurs affiliations successives par analyse sémantique. Cet aspect « Social Network »potentiellement très intéressant permet de visualiser sous forme de carte, les réseaux de collaborations d’auteurs.
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
En bref …
un "top 20" des auteurs ayant le plus publié sur le sujet, un "top 20" des publications classées par pays, un "top 20" des journaux dans lesquels on trouve le plus de publications en rapport avec le sujet, une courbe temporelle vous permettant de visualiser la progression (ou le recul) du nombre de publications par an sur ce sujet, une visualisation sous forme de graphe des réseaux de collaboration entre auteurs (répondant à la question "qui publie avec qui ?")".
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Les ontologies ?…L’objectif premier d’une ontologie est de modéliser un ensemble de connaissances dans un domaine donné (Définition Wikipédia)C’est un réseau sémantique qui regroupe un ensemble de concepts liés les uns aux autres par des relations taxonomiques (hiérarchisation des concepts) d'une part, et sémantiques d’autre part.
Extrait de «Les ontologies en biologie … la fin de Babel ?» Carl Herrmann – 2009
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
GO, MeSH …
Gene Ontology vise à construire une ontologie générique pour décrire le rôle d’un gène / protéine («gene product»)
Fonction biologique (kinase, protéase, liaison à l’ADN …)Processus biologique (signalisation, métabolisme)Localisation cellulaire (noyau, cytoplasme, membrane …)
C’est l’ontologie la plus développée et la plus utilisée (depuis 2000)
MeSH (Medical Subject Headings) est le thesaurus de Medline : un vocabulaire contrôlé et hiérarchisé qui permet de décrire précisément le contenu d’un articleL’arborescence hiérarchique conduit de concepts très larges à des notions très spécifiques. Les descripteurs MeSH sont choisis parmi un ensemble de synonymes pour décrire un concept de façon univoque.
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
La requête de recherche (1)
1ère voie : Recherche directement issue de Pubmed
(("Allergy and Immunology"[Mesh] OR "Hypersensitivity"[Mesh] OR "Peanut Hypersensitivity"[Mesh] OR "Food Hypersensitivity"[Mesh])) AND ("Arachis hypogaea"[Mesh] OR "arachis oil "[Substance Name])487 réponses dans Pubmed (le 20/11/09)
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
(("Allergy and Immunology"[Mesh] OR "Hypersensitivity"[Mesh] OR "Peanut Hypersensitivity"[Mesh] OR "Food Hypersensitivity"[Mesh])) AND ("Arachis hypogaea"[Mesh] OR "arachis oil "[Substance Name])
Copier – Coller de la requête Pubmed dans la
fenêtre de recherche GoPubmed
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
2ème voie : Recherche par saisie directePar sujet, auteur, journal … : elle est exécutée (et peut être saisie) selon la syntaxe de PubmedPar exemple :
Si l’on ne précise pas de champ de recherche, le terme saisi est recherché dans l’ensemble des champs.Pour rechercher un concept dans les champs Title et/ouAbstract, utiliser [TIAB], Pour rechercher un nom d’auteur, utiliser [AU] Pour rechercher une affiliation (University, Institute, Company, etc), utiliser [AD]. Pour rechercher un mot-clé, utiliser [MeSH]
La requête de recherche (2)
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Résultats
Clusters selon 4 axes
Résultats : 2887 références analysées de façon sémantique
Accès direct : statistiques générales
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Statistiques générales Top author
Affichage de l’auteur le plus représenté dans le lot des 2887 références
Top Author
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Focalisation possible :
Tous les éléments sont cliquables
Statistiques générales Statistics (1)
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Nombre de publications / année
Localisation / monde
Statistiques générales Statistics (2)
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Statistics (3) Cartographie : réseaux de collaboration / auteurs
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Affichage des 2887 références résultats
Possibilité d’affinage selon 4 axes différents
Statistiques générales Documents
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
what ?GoPubMed sélectionne les référencespertinentes pour la requête en coursIl analyse les résumés des documents sélectionnés et identifie les concepts relevant de termes présents dans :
le Gene Ontology les Medical Subject Headings (MeSH) le Universal Protein Resource
Ces termes sont ensuite classés et affichés dans le cluster what.L’exploration du corpus de résultat estainsi facilitée : l’utilisateur peutfocaliser sur un concept en cliquantsur un terme spécifique, il peut aussiréduire ou étendre sa rechercheinitiale en sélectionnant/désélectionnant des termes (Top Terms) ou des catégoriessémantiques (Knowledge Database).
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
who ?
Accès à différentes informations (3 onglets) sur chaque auteur identifié :- en cliquant dans la listeou- en faisant une recherche spécifique sur un nom.
Le système exécute un algorithme pour lever les ambiguités d’homonymie.
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
where ?
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
when ?
Filtre sur les dates de publications
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Affichage - Liste des résultats
Affichage plus détaillé (résumé)Accès au menu exportAccès aux statistiques (idem lien « statistics »
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Affichage - Référence
format réduit / format avec résumé
transfert dans un clipboard
passage en mode « curator »
accès au menu export
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Quelle utilisation ?Exploration d’un résultat de recherche issu de Pubmed.
Quel est le bon mot ? : l’exploration facilite l’identification de termes intéressantsAnalyse rapide et conviviale d’un lot de références
Analyse statistique et mise en formeRecherche de partenaires, de collaborations
Qui publie sur tel concept ?Quels sont les thèmes de prédilection d’un laboratoire ? et ses principaux partenaires …
INRA form@doc 2009 - D. L'Hostis - Décembre 2009
En savoir plus …
Doms, A.; Schroeder, M., 2005. GoPubMed: exploring PubMed with the Gene Ontology. Nucleic Acids Res, 33.