Jean-Claude Bradley présente a la nuit de la liberté au musée de la civilisation a l'université Laval le 8 novembre 2012. Cette présentation de 10 minutes discute des façons de partager la Science Ouverte en général et la Science par Cahier de Laboratoire Ouvert en particulier.
Nuit de la Liberté - Science Ouverte avec Jean-Claude Bradley
1. La Science Ouverte
Nuit de la Liberté 2012
Université Laval au Musée de la
Civilisation
Jean-Claude Bradley
Professeur de chimie
Université Drexel
8 Novembre 2012
3. Ce n’est pas the le cas pour la plupart des
bases de données scientifiques
Par exemple, quel est le
point de fusion de l’ éthanol?
4. On essai avec Google…
…mais d’où vient ce chiffre?
…est-ce un résultat fiable?
5. On essai avec NIST – une base de données
gouvernementale..
…et on obtient un résultat différent.
…En plus, les données ne sont pas
complètement ouvertes:
6. On essai avec ChemSpider – une base de
données par crowdsourcing..
…et on obtient d’autres résultats différents
7. C'est seulement après avoir recueilli le plus grand
nombre de sources possible que l'on peut observer
une convergence des données
8. C'est le contraire du modèle
« source fiable »
• Tous les résultats sont affichés et ne sont
jamais effacés
• Les valeurs aberrantes sont marqués en
rouge et ne contribuent pas à la moyenne
9. Les collections de données ouvertes sont
essentielles pour ce modèle
données
transformation
ouvertes données
ouvertes
données
ouvertes
enchaînement de provenance transparent
10. Collections ouvertes de données de Point de fusion
Actuellement 20.000 composés avec des points de fusion ouverts
11. La participation de tous les acteurs n'est pas
nécessaire pour la science ouverte
Il suffit en effet quelques contributions
• Seulement un seul fournisseur majeur chimique (Alfa
Aesar) et une seule agence gouvernementale (EPA) ont
accepté de faire don de leur collection de point de fusion
pour le domaine public
• Il y a maintenant suffisamment de sources ouvertes pour
observer une convergence évidente pour le point de fusion
de l'éthanol (et de nombreux autres composés)
12. Modélisation de données ouvertes de point de fusion
utilisant les descripteurs de CDK (Andrew Lang)
R2 = 0.78, TPSA and nHdon most important
34. Conclusions
• La science ouverte permet et encourage la
réutilisation maximale des données aux fins
pratiques.
• Il bénéficie à la fois celui qui partage et la
communauté scientifique.
• Il n'est pas nécessaire que tous les acteurs
contribuent ouvertement dans un domaine - dans
de nombreux cas il ne nécessite que quelques-
uns pour atteindre une masse critique.