La Science par Cahier de Laboratoire Ouvert

Preview:

DESCRIPTION

Cette présentation couvrira des méthodes et des outils utilisés pour rassembler, enregistrer et disséminer l'information chimique utilisant la Science par Cahier de Laboratoire Ouvert, la pratique de rendre un cahier de laboratoire et tous données brutes associées disponibles publiquement aussitôt que possible. Des mesures de solubilité et les réactions de chimie organique sont manipulées de cette façon. L'enregistrement des données de laboratoire est manipulé principalement utilisant des centres serveurs libres et tels que Wikispaces et Feuilles de Calcul de Google. L'information est rendue découvrable utilisant les voies de transmission superflues, y compris Google, Wikipedia et d'autres véhicules. L'abstraction des éléments clé des mesures de solubilité et des réactions chimiques permet la consommation automatisée de l’information. Les implications pour le futur de l'automation du processus scientifique basé sur des données ouvertes et des services ouverts seront discutées.

Citation preview

La Science par Cahier de Laboratoire Ouvert

Jean-Claude Bradley

Mai 9, 2011

ACFAS: Une Autre Science est Possible

Professeur de chimieUniversité Drexel

L'industrie partage de plus en plus de ses données

Possibilités de collaboration compétitive

Quelques initiatives pour la promotion de transparence dans la découverte de

médicaments

La Science par Cahier de Laboratoire Ouvert

Il n'existe pas de faits, seulement des valeurs

mesurées

La Science par Cahier de Laboratoire Ouvert maintient

l'intégrité de la provenance des données en mettant le contexte

des mesures explicite

CONFIANCE

PREUVE

Premièrement enregistrer et par la suite structurer

Afin d'être découvrable, utiliser des formats favorable pour Google (HTML simple, aucun

mot de passe)

Afin d'être reproductible libre utilisation des outils gratuits (Wikispaces, Google

Spreadsheets)

Stratégie pour un cahier de laboratoire ouvert :

Projet UsefulChem: la recherche Projet UsefulChem: la recherche fondamentale ouverte dans la conception fondamentale ouverte dans la conception

de médicaments en utilisant des outils de médicaments en utilisant des outils Web2.0Web2.0

Docking

Synthèse

Essais

Rajarshi GuhaIndiana U

JC BradleyDrexel U

Phil RosenthalUCSF

(paludisme)

Dan ZaharevitzNCI

(tumeurs)

Tsu-Soo TanNanyang Inst.

Cible pour le paludisme: falcipain-2impliqué dans le métabolisme

d'hémoglobine

Dana.org

La reaction de Ugi

Résultat de la collaboration Guha-Bradley-Rosenthal

Les références aux articles, blogs, pages cahier de laboratoire, les

données brutes

La réaction de Ugi: peut-on prédire les précipitations?

Peut-on prédire la solubilité dans les solvants organiques?

La collecte de données sur la solubilité par « crowdsourcing »

Juges pour le concour de solubilité

Gagnants du concour de solubilité

Les mesures de solubilité recueillies dans une feuille de

calcul Google

Requête Web basé sur la feuille de calcul Google (Rajarshi Guha)

Provenance des données:Un article de Wikipédia

conduit...

…au cahier de laboratoire et les données brutes

Spectres RMN interactifs utilisant JSpecView et JCAMP-DX

(Andy Lang, Tony Williams)

Spectres à partir de données ouverte pour l'enseignement

(Andy Lang, Tony Williams, Robert Lancashire)

Données brutes en images

Splatter?

Some liquid

YouTube pour démontrer les expériences

L'importance de la disponibilité des données brutes

Manqué dans une publication

préalable sur la solubilité de ce

composé

Etude de cas:  Cours de Recherche

d‘Information Chimique à Drexel (automne 2009/2010)

Optimisation du système éducatif pour contribuer nouvelle science

La fiche de validation de l'information chimique

567 mesures vérifiées et référencées

L'explorateur de validation de l'information chimique

(Andrew Lang)

Découvrir les valeurs aberrantes pour des points de fusion

Recherche de l‘incohérence du p.f. de EGCG

Recherche de l’ incohérences du p.f. de cyclohexanone

Sigma-Aldrich, Acros and Wolfram Alpha utilisent apparemment les mêmes sources pour les points

de fusion

Sigma-Aldrich, Acros and Wolfram Alpha utilisent apparemment les mêmes sources pour les points

d'ébullition

Sigma-Aldrich, Acros and Wolfram Alpha utilisent apparemment PAS les mêmes sources pour les

points d'éclair

Sources de données les plus utilisés

Alfa Aesar fait don de leurs points de fusion au public

Explorateur de Point de fusion

Valeurs aberrantes

MDPI dataset

EPI (via ChemSpider)

Valeurs aberrantes

Alfa Aesar

Les incohérences et les problèmes de SMILES dans le dataset MDPI

Ensemble de données MDPI étiquetés avec un Haut Niveau de confiance

Ensembles de données de points de fusion

Modélisation de données ouvertes de point de fusion utilisant les descripteurs de CDK (Andrew

Lang)

R2 = 0.78, TPSA and nHdon most important

Service de prediction de point de fusion

Autres services web…

(Andrew Lang)

Modélisation de solubilité

Services Web dans une feuille de calcul Google

(Andrew Lang)

Intégration des services Web multiples à Recommander Solvants

pour réactions

(Andrew Lang)

Utilisation de point de fusion pour la prédiction de la solubilité dépendante de la

température

Livre Reaction Attempts

Reactions

Services Web

Archives

Livre de Solubilite cite pour une application de nanotechnologie

(Don Pellegrino)

Carte sociale de chercheurs et produits chimiques

Decanoic acid

WaterNaCl

Recherche pour les applications de la solubilité sur le cancer du sein

Solubilité prévisée pour le Taxol

Pred Exp

Prédictions de la solubilité du Taxol dans l’eau selon la température (M)

Conclusions

Utilisez des outils web gratuits et formats de données ouverts et partagez aussitôt que

possible

1. Google Spreadsheets2. Wikispaces3. YouTube, SlideShare, LuLu, Nature Precedings,

etc. 4. JCAMP-DX

Recommended