Upload
jean-claude-bradley
View
15.249
Download
2
Embed Size (px)
DESCRIPTION
Cette présentation couvrira des méthodes et des outils utilisés pour rassembler, enregistrer et disséminer l'information chimique utilisant la Science par Cahier de Laboratoire Ouvert, la pratique de rendre un cahier de laboratoire et tous données brutes associées disponibles publiquement aussitôt que possible. Des mesures de solubilité et les réactions de chimie organique sont manipulées de cette façon. L'enregistrement des données de laboratoire est manipulé principalement utilisant des centres serveurs libres et tels que Wikispaces et Feuilles de Calcul de Google. L'information est rendue découvrable utilisant les voies de transmission superflues, y compris Google, Wikipedia et d'autres véhicules. L'abstraction des éléments clé des mesures de solubilité et des réactions chimiques permet la consommation automatisée de l’information. Les implications pour le futur de l'automation du processus scientifique basé sur des données ouvertes et des services ouverts seront discutées.
Citation preview
La Science par Cahier de Laboratoire Ouvert
Jean-Claude Bradley
Mai 9, 2011
ACFAS: Une Autre Science est Possible
Professeur de chimieUniversité Drexel
L'industrie partage de plus en plus de ses données
Possibilités de collaboration compétitive
Quelques initiatives pour la promotion de transparence dans la découverte de
médicaments
La Science par Cahier de Laboratoire Ouvert
Il n'existe pas de faits, seulement des valeurs
mesurées
La Science par Cahier de Laboratoire Ouvert maintient
l'intégrité de la provenance des données en mettant le contexte
des mesures explicite
CONFIANCE
PREUVE
Premièrement enregistrer et par la suite structurer
Afin d'être découvrable, utiliser des formats favorable pour Google (HTML simple, aucun
mot de passe)
Afin d'être reproductible libre utilisation des outils gratuits (Wikispaces, Google
Spreadsheets)
Stratégie pour un cahier de laboratoire ouvert :
Projet UsefulChem: la recherche Projet UsefulChem: la recherche fondamentale ouverte dans la conception fondamentale ouverte dans la conception
de médicaments en utilisant des outils de médicaments en utilisant des outils Web2.0Web2.0
Docking
Synthèse
Essais
Rajarshi GuhaIndiana U
JC BradleyDrexel U
Phil RosenthalUCSF
(paludisme)
Dan ZaharevitzNCI
(tumeurs)
Tsu-Soo TanNanyang Inst.
Cible pour le paludisme: falcipain-2impliqué dans le métabolisme
d'hémoglobine
Dana.org
La reaction de Ugi
Résultat de la collaboration Guha-Bradley-Rosenthal
Les références aux articles, blogs, pages cahier de laboratoire, les
données brutes
La réaction de Ugi: peut-on prédire les précipitations?
Peut-on prédire la solubilité dans les solvants organiques?
La collecte de données sur la solubilité par « crowdsourcing »
Juges pour le concour de solubilité
Gagnants du concour de solubilité
Les mesures de solubilité recueillies dans une feuille de
calcul Google
Requête Web basé sur la feuille de calcul Google (Rajarshi Guha)
Provenance des données:Un article de Wikipédia
conduit...
…au cahier de laboratoire et les données brutes
Spectres RMN interactifs utilisant JSpecView et JCAMP-DX
(Andy Lang, Tony Williams)
Spectres à partir de données ouverte pour l'enseignement
(Andy Lang, Tony Williams, Robert Lancashire)
Données brutes en images
Splatter?
Some liquid
YouTube pour démontrer les expériences
L'importance de la disponibilité des données brutes
Manqué dans une publication
préalable sur la solubilité de ce
composé
Etude de cas: Cours de Recherche
d‘Information Chimique à Drexel (automne 2009/2010)
Optimisation du système éducatif pour contribuer nouvelle science
La fiche de validation de l'information chimique
567 mesures vérifiées et référencées
L'explorateur de validation de l'information chimique
(Andrew Lang)
Découvrir les valeurs aberrantes pour des points de fusion
Recherche de l‘incohérence du p.f. de EGCG
Recherche de l’ incohérences du p.f. de cyclohexanone
Sigma-Aldrich, Acros and Wolfram Alpha utilisent apparemment les mêmes sources pour les points
de fusion
Sigma-Aldrich, Acros and Wolfram Alpha utilisent apparemment les mêmes sources pour les points
d'ébullition
Sigma-Aldrich, Acros and Wolfram Alpha utilisent apparemment PAS les mêmes sources pour les
points d'éclair
Sources de données les plus utilisés
Alfa Aesar fait don de leurs points de fusion au public
Explorateur de Point de fusion
Valeurs aberrantes
MDPI dataset
EPI (via ChemSpider)
Valeurs aberrantes
Alfa Aesar
Les incohérences et les problèmes de SMILES dans le dataset MDPI
Ensemble de données MDPI étiquetés avec un Haut Niveau de confiance
Ensembles de données de points de fusion
Modélisation de données ouvertes de point de fusion utilisant les descripteurs de CDK (Andrew
Lang)
R2 = 0.78, TPSA and nHdon most important
Service de prediction de point de fusion
Autres services web…
(Andrew Lang)
Modélisation de solubilité
Services Web dans une feuille de calcul Google
(Andrew Lang)
Intégration des services Web multiples à Recommander Solvants
pour réactions
(Andrew Lang)
Utilisation de point de fusion pour la prédiction de la solubilité dépendante de la
température
Livre Reaction Attempts
Reactions
Services Web
Archives
Livre de Solubilite cite pour une application de nanotechnologie
(Don Pellegrino)
Carte sociale de chercheurs et produits chimiques
Decanoic acid
WaterNaCl
Recherche pour les applications de la solubilité sur le cancer du sein
Solubilité prévisée pour le Taxol
Pred Exp
Prédictions de la solubilité du Taxol dans l’eau selon la température (M)
Conclusions
Utilisez des outils web gratuits et formats de données ouverts et partagez aussitôt que
possible
1. Google Spreadsheets2. Wikispaces3. YouTube, SlideShare, LuLu, Nature Precedings,
etc. 4. JCAMP-DX