Guide pour la publication d’ensemble de données

Learn about tools, processes and best practices for publishing datasets through the GBIF network

Sunflower
Sunflower by Stefan Gara licensed under CC BY-NC-ND 2.0

Le site GBIF.org supporte la publication de quatre types d‘ensemble de données.

Pour l’instant, le réseau GBIF publie seulement les données en provenance d’organisations : institutions et réseaux.

Individuals who wish to publish relevant datasets should work through their affiliated organizations (see ‘Request endorsement’ below) or consider submitting a data paper to one of a growing number of journals.

Les citoyens scientifiques peuvent également partager leurs observations en contribuant en participant au nombre croissant de projets dans le monde entier qui publient leurs ensembles de données par l’intermédiaire du réseau GBIF.

S’assurer de vos accords institutionnels internes

Une fois que vous décidez de publier des données via le GBIF, vous devez alerter vos administrateurs de votre intention de faire des publications au nom de votre institution. Le partage des données via le GBIF peut accroître la visibilité et l’impact général de votre institution en s’appuyant sur des méthodes traditionnelles comme les publications académiques, les prêts de spécimens et autres.

Demande de validation

La validation des nouveaux éditeurs de données est une procédure de la communauté GBIF dont le but est de s’assurer que:

  • Les données sont pertinentes et épousent les buts et objectifs du GBIF
  • Les solutions d’hébergement des données sont stables et durables
  • Les réseaux nationaux, régionaux et thématiques sont engagés de manière active dans la publication et l’utilisation des données
  • Les données peuvent être partagées et re-utilisées gratuitement
  • La qualité des données peut être améliorée par les éditeurs de données répondant aux commentaires
    Nous encourageons les organisations à demander leur validation dès qu’elles envisagent de partager leurs données via le GBIF, afin d’éviter les retards de la publication des données.

Familiarisez-vous avec les outils de publication, les flux de travail et/ou les partenaires

La plupart des données actuellement partagées via le GBIF sont hébergées sur l’une des dizaines installations IPT (Outils Intégrés de Publication) (voir les statistiques). D’autres alternatives existent, y compris le support d’hébergement par les noeuds nationaux et/ou d’autres participants actifs (comme iDigBio). De plus, les programmeurs désirant automatiser l’enregistrement des ensembles de données peuvent le faire en utilisant l’API du GBIF. Nous disposons enfin d’une banque d’informations complète incluant outils et documentations, ainsi que des manuels détaillés pour les éditeurs.

Préparer les données à la publication

Publishers who choose to share their data using Darwin Core Archives (see data standards) can familiarize themselves with the format using spreadsheet templates created for occurrence datasets, checklists and sampling-event datasets.

Using the updated GBIF Data Validator, you can check datasets prior to publication and receive specific recommendations on improving and cleaning them. The report will help, for instance, by flagging duplicate records, incomplete fields and recognized inconsistencies in formatting.

You can also prepare datasets to comply with GBIF’s data quality requirements.

Choose a Creative Commons license

In keeping with a 2014 decision by the GBIF governing board, data publishers must assign one of the three Creative Commons licences to any occurrence dataset:

  • CC0, for data made available for any use without any restrictions
  • CC BY, for data made available for any use with appropriate attribution
  • CC BY-NC, for data made available for any non-commercial use with appropriate attribution



Note that CC-BY-NC licences have a significant effect on the reusability of data. GBIF encourages data publishers to choose the most open option they can wherever possible.

Publier des données

Si vous utilisez un IPT, il suffit de cliquer sur le bouton pour “Enregistrer” vos ensembles de données sur GBIF. Votre page d’éditeur de données et les informations relatives à votre ensemble de données deviendront visibles sur GBIF.org, et notre infrastructure va commencer à indexer les occurrences individuelles en temps-réel.

Once published, you can view some quick metrics on your dataset (example) , user download activity (example) and traceable literature citations (example).

Etapes suivantes

  • Envisager la publication de vos métadonnées sous forme de Data Paper (articles scientifiques)
  • Rejoindre le réseau de volontaires pour traduire l’IPT dans votre langue maternelle

Nos remerciements à Pierre Radji, GBIF Togo, et Sophie Pamerlon, GBIF France, pour le soutien de la traduction.