As open as possible, as closed as necessary

Partager ses données n’implique pas de tout diffuser au monde entier et sans délai. Tout est dit dans la punchline de l’Union Européenne sur le sujet : "As open as possible, as closed as necessary", il s’agit de les rendre disponibles au plus grand nombre pour faire progresser la science tout en respectant le cadre juridique, éthique et contractuel du projet.

Tableau dynamique d'aide à la sélection d'entrepôts et de revues

Document 1 : Pôle IST de l'École des Ponts ParisTech. Tableau dynamique d'aide à la sélection d'entrepôts et de revues, 2017

Description des essais sur les chaux et ciments

Document 2 : Mouret, Georges. Description des essais sur les chaux et ciments, 1885

Description des essais sur les chaux et ciments

Document 2 : Mouret, Georges. Description dese ssais sur les chaux et ciments, 1885

Les 4 principes du Fair data

Les principes Fair de gestion des données de la recherche

Les supplementary materials, oui mais...

Les supplementary materials constituent un premier effort louable de partage mais qui pose un problème concernant la conservation à long terme, l’impossibilité fréquente de pouvoir identifier ces données indépendamment de la publication et enfin les problèmes de droits cédés à l’éditeur de la revue. Enfin, l’accès à ces données est parfois bloqué par un abonnement payant.

Le triangle d'or : data, paper, data paper !

Il est préférable de déposer ses données dans un entrepôt de données (data repository) et d’y appliquer une licence (voir section "Aux données bien partagées, la valeur n'attend pas le nombre des années"). Pensez à utiliser le tableau dynamique mis au point par le Pôle IST (document 1) pour identifier un entrepôt parmi des entrepôts institutionnels (Harvard Dataverse, Sextant pour l’IFREMER), des entrepôts thématiques (Pangaea, EarthChem, Materials Data Facility), des entrepôts multi-disciplinaires (Figshare, Zenodo, Dryad, Nakala). Les dépôts sont décrits par des métadonnées standardisées qui facilitent le repérage et la citation des données dans la mesure où un DOI leur est attribué. Pour identifier un entrepôt de confiance (trusted repository), il existe une certification, CoreTrustSeal, qui a entrepris de certifier à la demande les entrepôts répondant à des critères de qualité concernant le stockage, l’intégrité et les modalités de mise à disposition.

Grâce au DOI de la ou des publications qui exploitent un dataset et à celui du dataset lui-même, un lien bidirectionnel pérenne est ainsi créé pour que chacun signale l’autre.
Enfin, pour une meilleure valorisation d’un jeu de données, son producteur pourra publier un data paper (ou software paper pour un logiciel). L’objectif est de décrire les données, comment elles ont été produites ou collectées. La publication de ce data paper (soumise au processus classique de peer-reviewing) permettra d’informer la communauté de l’existence du dataset et d’en faciliter la réutilisation. Le data paper tout comme le dataset pourront faire l’objet de citations.

Inspirez-vous de Mouret, qui, en 1885, a produit une description précise de ses essais sur les chaux et ciments, sa méthodologie et les appareils utilisés (document 2), un véritable data paper avant l’heure !

Soyez FAIR ! 

Pendant toute la durée de votre recherche, pensez à respecter les principes FAIR afin de garantir que vos données puissent être trouvées et exploitées par des humains et des machines.