Upload
jean-claude-bradley
View
319
Download
0
Embed Size (px)
DESCRIPTION
Jean-Claude Bradley présente a la nuit de la liberté au musée de la civilisation a l'université Laval le 8 novembre 2012. Cette présentation de 10 minutes discute des façons de partager la Science Ouverte en général et la Science par Cahier de Laboratoire Ouvert en particulier.
Citation preview
La Science Ouverte
Jean-Claude Bradley
8 Novembre 2012
Nuit de la Liberté 2012Université Laval au Musée de la
Civilisation
Professeur de chimieUniversité Drexel
Aujourd’hui on prend pour acquis l'accès libre a certaines bases de
données
Ce n’est pas the le cas pour la plupart des bases de données scientifiques
Par exemple, quel est le point de fusion de l’ éthanol?
On essai avec Google…
…mais d’où vient ce chiffre?…est-ce un résultat fiable?
On essai avec NIST – une base de données gouvernementale..
…et on obtient un résultat différent.…En plus, les données ne sont pas
complètement ouvertes:
On essai avec ChemSpider – une base de données par crowdsourcing..
…et on obtient d’autres résultats différents
C'est seulement après avoir recueilli le plus grand nombre de sources possible que l'on
peut observer une convergence des données
C'est le contraire du modèle « source fiable »
• Tous les résultats sont affichés et ne sont jamais effacés
• Les valeurs aberrantes sont marqués en rouge et ne contribuent pas à la moyenne
Les collections de données ouvertes sont essentielles pour ce modèle
données ouvertesdonnées ouvertes
données ouvertes
transformation
enchaînement de provenance transparent
Collections ouvertes de données de Point de fusionActuellement 20.000 composés avec des points de fusion ouverts
La participation de tous les acteurs n'est pas nécessaire pour la science ouverte
Il suffit en effet quelques contributions
• Seulement un seul fournisseur majeur chimique (Alfa Aesar) et une seule agence gouvernementale (EPA) ont accepté de faire don de leur collection de point de fusion pour le domaine public
• Il y a maintenant suffisamment de sources ouvertes pour observer une convergence évidente pour le point de fusion de l'éthanol (et de nombreux autres composés)
Modélisation de données ouvertes de point de fusion utilisant les descripteurs de CDK (Andrew
Lang)
R2 = 0.78, TPSA and nHdon most important
La Science par Cahier de Laboratoire Ouvert
La collecte de données sur la solubilité par « crowdsourcing »
Les mesures de solubilité recueillies dans une feuille de calcul Google
Requête Web basé sur la feuille de calcul Google (Rajarshi Guha)
Provenance des données:Un article de Wikipédia
conduit...
…au cahier de laboratoire et les données brutes
Données brutes en images
Splatter?
Some liquid
YouTube pour démontrer les expériences
Cours de Recherche d‘Information Chimique à Drexel (automnes 2009-
2012)
Optimisation du système éducatif pour contribuer de la nouvelle
science
La fiche de validation de l'information chimique
Environs 2000 mesures vérifiées et référencées
Explorateur de Point de fusion
Services Web dans une feuille de calcul Google
(Andrew Lang)
Intégration des services Web multiples à Recommander Solvants pour
réactions
(Andrew Lang)
Utilisation de point de fusion pour la prédiction de la solubilité dépendante de la
température
Livre Reaction Attempts
Reactions
Services Web
Archives
Conclusions
• La science ouverte permet et encourage la réutilisation maximale des données aux fins pratiques.
• Il bénéficie à la fois celui qui partage et la communauté scientifique.
• Il n'est pas nécessaire que tous les acteurs contribuent ouvertement dans un domaine - dans de nombreux cas il ne nécessite que quelques-uns pour atteindre une masse critique.