Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Interrogation des banques de séquences sur différents serveurs
• EBI SRS : DKFZ
•NCBI Entrez
• ACNUC - WWW-Query
• UCSC
• EnSembl
• ENCODE
Serveurs Généralistes SRS, Entrez, ACNUC
http://srs.ebi.ac.uk → À la retraite :-)
Déplacés ou inactifs!!
le plus complet...
Principes (SRS)
4 niveaux de requêtes : sélection des champs (par défaut l'ensemble des champs
indexés)
• Liens entre les niveaux : AND (par défaut) OR et BUTNOT
• Extension des mots par * (défaut) . (case wildcard *)
• Utilisation des opérateurs logiques : & (et) , | (ou) , ! (but not) dans
un champ
• Opérations plus complexes dans un champ:
(critere1* | critere2*) & ( critere3 ! critere4)
En général les requêtes doivent se faire sur des mots simples
(éventuellement liés par des opérateurs logiques) : "globin & mouse" et
non "globin mouse"
Seuls les champs organismes sont composés : homo sapiens (et non homo
& sapiens)
Certains champs sont numériques : SeqLength, avec bornes max et min
(1000:50000)
• Output fields: Sélection des champs à
visualiser dans la liste résultante
• Display list: Affichage des réponses sous
forme de liste (par défaut) ou de tableau
• Sequence Format: Sélection des formats de
séquences
• Info: Liste et description du champ “Alltext“ ou
du champ sélectionné
Options de sortie communément disponibles
Plutôt qu’un long discours → http://www.dkfz.de/srs/
Travaux Pratiques - Utilisation du système SRS
Q1: Cherchez dans la banque EMBL le mot clef “prion”. Combien de séquences
obtient-on? Étudiez brièvement le contenu d’une fiche EMBL en cliquant sur son
numéro d’accession.
Q2: Cherchez dans la banque EMBL le mot clef “prion” mais uniquement chez
l’homme.
Q3: Réalisez la requête ennoncée en Q2 mais cette fois sur la section
SWISSPROT. Combien de séquences obtient-on? Qu’apprend-on en lisant la
fiche SWISSPROT P04156?
Liste sélectionnée :Affichage sous forme de tableau
Affichage de la liste résultante :un clic sur une ligne de
la liste visualise le document associé
Naviguer de base en base
Sélection des banques pour établir des liens avec une vue particulière (ici la liste seule des identifieurs)
Par défaut : recherche de liens vers les banques cibles
L'opération réverse (non symétrique) permet de sélectionner les entrées dans les banques cibles qui ont comme liens
l'ensemble source)
Historique des “Queries” : Results
Q5 > SwissProt
construction d'équation permettant l'obtention de cibles :
Q5 & Q6
Q5>SwissProt > PDB
SwissProt >PDB ....
http://www.ebi.ac.uk/services/dna-rna
https://www.ebi.ac.uk/ena
https://www.ebi.ac.uk/ena/data/view/BN000065
https://www.ncbi.nlm.nih.gov/
Plutôt qu’un long discours → https://www.ncbi.nlm.nih.gov/
Travaux Pratiques - Utilisation du système ENTREZ
Q1: Cherchez les séquences protéiques de prions chez l’homme. Combien de
séquences distinctes obtient-on?
Q2: Comment expliquer la différence avec la recherche SWISSPROT sur le
système SRS?
Q3: Comment faire des requêtes complètes avec ENTREZ (opérateurs logiques,
contraintes de champs…)?
Interrogation de Protéines : le Prion
Séquences sous brevet
Accès à des outils de comparaison - BLAST
Recherche dans la section “Gene”
Contexte Génomique
Pour aller plus loin - Les liens vers les autres ressources...
http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=announcement
Repository NGS sequencing
http://doua.prabi.fr/search
ACNUC - WWW-Query
Banques généralistes + banques locales
(HoVerGen, HoBacGen, HoGenome,
Phever…)
Bases de données d’expression ArrayExpress, GEO
http://www.ebi.ac.uk/arrayexpress/
http://www.ncbi.nlm.nih.gov/geo/
Serveurs orientés protéines Expasy, Uniprot, Prosite, PFAM
http://www.expasy.org
http://www.uniport.org
http://www.uniport.org
http://pfam.xfam.org/
Autres serveurs UCSC Genome Browser, Ensembl, Encode
https://genome.ucsc.edu
https://genome.ucsc.edu
http://www.ensembl.org
https://www.encodeproject.org/
https://www.encodeproject.org/biosamples/ENCBS220III/
EnCODE Statistiques
Homo sapiens - Statistiques
RNAseq Humain
Workflows d’analyses et données
Workflows d’analyses et données