Data Incognita

Frontispice de l'ouvrage de Francis Bacon, Operum moralium et civilium tomus...

Frontispice de l'ouvrage de Francis Bacon, 1638, Operum moralium et civilium tomus...

Les données, une histoire ancienne !

Au XVIIe siècle, Francis Bacon évoquait déjà dans son Novum Organum la nécessité de recourir aux données dans une virulente critique de la manière dont la science était faite jusqu’alors, un véritable plaidoyer en faveur de l'Open Science !

"Notre histoire naturelle ne recherche rien suivant les véritables règles, ne vérifie, ne compte, ne pèse, ne mesure rien. Mais tout ce qui est indéterminé et vague dans l’observation, devient inexact et faux dans la loi générale."
Francis Bacon, Novum Organum, 1620

Avec cette exposition, le Pôle Information Scientifique et Technique (IST) de l'École des Ponts ParisTech veut montrer aux chercheurs que les données ont toujours été au cœur de l'activité des ingénieurs et chercheurs de l'École. On en trouve la trace dans son fonds patrimonial et par conséquent, les chercheurs doivent les valoriser aujourd'hui, et ne pas attendre d'avoir intégré le fonds ancien pour les partager !

Cette exposition aborde les divers aspects de la gestion des données de la recherche, depuis leur collecte et leur traitement, jusqu’à leur analyse et leur valorisation. Elle s’appuie sur les travaux des anciens des Ponts pour établir un parallèle saisissant entre les pratiques actuelles et passées et montrer comment Prony, Surell, Minard, de Chézy, Malézieux, Vauthier, d'Ocagne, Bourdalouë et d’autres illustres ingénieurs de l'École avaient déjà saisi l’importance du partage des données pour le bien de la science.

Cette exposition virtuelle prolonge l'exposition physique installée dans le Hall de l'École des Ponts du 23 octobre au 17 novembre 2017, à l'occasion de l'Open Access Week.

Data is the new oil

Nous sommes désormais dans l'ère de l'exploration des données, celles capturées par des instruments ou générées par des simulations et on parle de "data-intensive science". On considère les data comme le nouveau pétrole. Clive Humby, mathématicien britannique a popularisé la formule en 2006 :

Data is the new oil. It’s valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc to create a valuable entity that drives profitable activity; so must data be broken down, analyzed for it to have value."
Clive Humby, 2006

Scientists losing data at a rapid rate

Graphique issu de l'étude : Vines TH el al, 2014, The Availability of Research Data Declines Rapidly with Article Age, Current Biology, Vol 24(1)

Pourquoi partager ?

La revue ou le financeur l'exigent dans leur Data policy pour fiabiliser leurs publications.

Pour le bien de la science et favoriser ainsi la réplicabilité, déclencher de nouvelles collaborations et favoriser l'innovation mais aussi pour retrouver plus facilement les données (parfois même les siennes). Une étude a montré en 2014 (Vines et al) que la disponibilité des données d’articles scientifiques diminuait de façon vertigineuse au fil du temps : 25% des auteurs qui répondent aux demandes confirment les avoir conservées au bout de 20 ans ; seules 5% des données sont récupérées en tenant compte de ceux qui ne répondent pas.

Pour augmenter sa visibilité ; les études montrent en effet que partager ses données, à l'instar de publier en Open Access, a un impact positif sur le taux de citations (+9% citations selon l'étude de Piwowar & Vision, 2013, Data reuse and the open data citation advantage, PeerJ, e175). Par ailleurs, le Comité d’éthique du CNRS a émis la préconisation suivante en 2015 : "Le travail de mise à disposition de données utilisables à partir de données brutes doit être reconnu dans l'évaluation et les décisions de promotion des personnels qui s’y impliquent."

"The days of keeping our research results to ourselves are over. There is far more to gain from sharing data and letting others access and analyse that data."
Carlos Moedas, European Commissioner for Research, Science and Innovation, 2015

N'attendez pas d'avoir intégré le fonds ancien pour partager vos données !