Exigences de qualité des données

Les éditeurs jouent un rôle essentiel non seulement dans le partage des jeux de données mais aussi dans la gestion de leur qualité, leur complétude et utilité, et assurent leur intégration et leur valeur dans la base de connaissances globale du GBIF.

Ploceus-philippinus-iNat-Malay-Mehta
Male baya weaver (Ploceus philippinus) waits outside as a female inspects the nest he built from inside. Females baya weavers select mates on the basis of the quality of nest construction. Photo by Malay Mehta via iNaturalist Research-grade observations, licensed under CC BY-NC 4.0.

Pour partager des données via GBIF.org, les éditeurs doivent généralement rassembler ou transformer des jeux de données existants en un standardized format. Ce travail peut inclure un traitement supplémentaire, des éditions sur contenu et la conversion du contenu d'un jeu de données vers l'un des formats de transfert de données disponibles, ainsi que la publication à l'aide d'un des outils de publication de données disponibles, tels que le Integrated Publishing Toolkit du GBIF, qui est gratuit et open-source.

Une fois publié, l'infrastructure en temps réel du GBIF ‘indexes’ or ‘harvests’ new datasets, les intègre dans un système d'accès commun où les utilisateurs peuvent récupérer toutes les données grâce à des services de recherche et de téléchargement communs. Comme les jeux de données sont indexés, GBIF.org effectue des vérifications supplémentaires, routines d'interprétation et de conversion pour s'assurer que les données sont interopérables et conformes aux standards minimaux de data formats, data quality et adéquation à l'utilisation. Cependant, de nombreux critères de qualité et d'utilisabilité des données sont mieux et plus facilement gérables lorsqu'ils sont traités à leur source : le jeu de données individuel.

Les éditeurs jouent un rôle essentiel non seulement dans le partage des jeux de données mais aussi dans la gestion de leur qualité, leur complétude et utilité, et assurent leur intégration et leur valeur dans la base de connaissances globale du GBIF. En savoir plus sur les exigences et recommandations de qualité des données pour les

En pratique, nous encourageons les responsables de la publication des données à se familiariser avec les formats de données attendus et les exigences en matière de contenu le plus tôt possible dans le processus (voir également les templates Excel GBIF préconfigurés avec les termes requis et recommandés pour les jeux de données d'occurrence, les listes d'espèces, et les jeux de données d'échantillonnages, tous disponibles avec des exemples de données). Cela permettra d'économiser beaucoup d'efforts qui peuvent être nécessaires à des étapes ultérieures, par exemple en ajoutant des conversions de données, la saisie de l'information pour les champs requis ou fortement recommandés, ou l'exécution et le traitement des contrôles finaux de la qualité des données de pré-publication.