Guide rapide pour la publication des données via GBIF.org

En savoir plus sur les outils, les processus et les meilleures pratiques pour la publication de jeux de données via le réseau GBIF

data publishing hero image

Le site GBIF.org supporte la publication de quatre types de jeux de données en utilisant les normes de données de biodiversité largement acceptés.

Pour l’instant, le réseau GBIF publie seulement les jeux de données provenant directement d’organisations. Les personnes qui souhaitent publier des ensembles de données pertinents doivent passer par leurs organisations affiliées (voir "Demande d'approbation" ci-dessous) ou envisager de soumettre un document de données (data paper) à l'une des nombreuses revues disponibles.

Les citoyens scientifiques peuvent contribuer indirectement aux enregistrements d'occurrences en participant au nombre croissant de projets dans le monde qui publient leurs ensembles de données via le réseau GBIF.

Sécuriser les accords institutionnels

Une fois que vous décidez de publier des données via le GBIF, vous devez alerter vos administrateurs de votre intention de faire des publications au nom de votre institution. Le partage de données ouvertes peut accroître la visibilité et l'impact des institutions, en s'appuyant sur des méthodes traditionnelles telles que les publications universitaires et les prêts de spécimens pour révéler de nouvelles opportunités de collaboration et, grâce à l'utilisation de citations basées sur le DOI, établir un lien direct avec l'utilisation en recherche (exemple).

Demande d'approbation

Pour devenir un éditeur de données, votre organisation doit demander l'approbation de de la communauté GBIF. Une fois que vous avez examiné l'accord d'éditeur de données et que vous acceptez en principe de partager les données, nous vous encourageons à demander l'approbation de votre organisation dès que possible afin d'éviter des retards dans la publication des données.

Sélectionner les outils de publication et les partenaires

Une grande partie des données désormais partagées avec le GBIF sont hébergées sur l'une des dizaines d'installations IPT : Integrated Publishing ToolkitGBIF et, de plus en plus, sur les installations nationales de la plateforme Living Atlases développée à l'origine par l'Atlas of Living Australia.

D'autres arrangements alternatifs existent, y compris ceux pour l'hébergement des données à la fois à l'intérieur et à l'extérieur d'une institution de publication de données particulière. Les éditeurs hautement qualifiés peuvent également utiliser une API pour automatiser l'enregistrement des ensembles de données (contactez le service d'assistance du GBIF pour plus de détails).

Nous maintenons également une base de connaissances sur les outils et d'autres documents.

Préparer les données pour la publication

Publishers who choose to share their data using Darwin Core Archives (see data standards) can familiarize themselves with the format using spreadsheet templates created for occurrence datasets, checklists and sampling-event datasets.

En utilisant le Validateur de données GBIF, vous pouvez vérifier les jeux de données avant leur publication et recevoir des recommandations spécifiques pour les améliorer et les nettoyer. Le rapport aidera, par exemple, à signaler les enregistrements en double, les champs incomplets et les incohérences reconnues dans le formatage.

Vous pouvez également préparer des jeux de données pour répondre aux exigences de qualité des données du GBIF.

Choisissez une licence Creative Commons

In keeping with a 2014 decision by the GBIF governing board, data publishers must assign one of the three Creative Commons licences to any occurrence dataset:

  • CC0, pour les données disponibles pour toute utilisation sans aucune restriction
  • CC BY, pour les données mises à disposition pour toute utilisation moyennant une attribution appropriée
  • CC BY-NC, pour les données disponibles pour toute utilisation non commerciale et moyennant une attribution appropriée



Notez que les licences CC-BY-NC ont un effet significatif sur la réutilisabilité des données. Le GBIF encourage les éditeurs de données à choisir l'option la plus ouverte possible.

Publier des données

Si vous utilisez un IPT, il suffit de cliquer sur le bouton pour “Enregistrer” vos ensembles de données sur GBIF. Une fois la publication effectuée, vous pouvez consulter quelques indicateurs rapides sur votre jeu de données (exemple), l'activité de téléchargement des utilisateurs (exemple) et les citations bibliographiques traçables (exemple).

Avantages de la publication des données de biodiversité en libre accès

Une partie importante de la mission du GBIF consiste à promouvoir une culture dans laquelle les gens reconnaissent les avantages de la publication de données sur la biodiversité en libre accès, pour eux-mêmes comme pour la société en général.

  • En rendant vos données accessibles par le biais du GBIF et d'autres infrastructures d'information similaires, vous **contribuerez à la connaissance globale de la biodiversité<0>, et donc aux solutions qui favoriseront sa conservation et son utilisation durable.
  • La publication de données permet d'intégrer des ensembles de données détenus dans le monde entier, révélant ainsi de nouvelles possibilités de collaboration entre les propriétaires de données et les chercheurs.
  • La publication des données permet aux individus et aux institutions d'être correctement crédités pour leur travail de création et de conservation de données sur la biodiversité, en donnant de la visibilité aux institutions de publication grâce à la création de bonnes métadonnées. Cette reconnaissance peut être renforcée si vous êtes l'auteur d'un article sur les données évalué par les pairs, ce qui confère une reconnaissance scientifique à la publication d'ensembles de données sur la biodiversité.
  • Les gestionnaires de collections peuvent tracer l'utilisation et les citations des données numérisées publiées par leurs institutions et accessibles par le biais du GBIF et d'infrastructures similaires.
  • Certaines agences de financement exigent désormais des chercheurs recevant des fonds publics qu'ils rendent les données librement accessibles à la fin d'un projet.