Les différents types de jeu de données

Les quatre types de jeu de données supportées par le GBIF, du plus simple au plus sophistiqué (plus riche, plus structuré mais aussi plus complexe)

Biodiversity
Biodiversity by RayMorris1 licensed under CC BY-NC-ND 2.0.

Nous encourageons les détenteurs de données à publier les données les plus riches possibles pour assurer leur utilisation dans le plus large éventail d’approches et questions scientifiques. Toutefois, tous les jeux de données ne possèdent pas les mêmes niveaux de précision. Partager tout ce qui peut l’être via le site GBIF.org est important, car même une information partielle peut apporter des réponses à d’importantes questions.

Vous trouverez ci-dessous les descriptions des quatre classes de jeux de données actuellement prises en charge par GBIF.

Ressources de métadonnées seules

A son niveau de base, GBIF.org permet aux institutions de créer des jeux de données décrivant des ressources non numérisées telles que celles des collections d’histoire naturelle par exemple. Les trois autres types d’ensemble de données comportent cette information de base, mais ce type de ‘métadonnées seules’ offre aux chercheurs un outil précieux pour découvrir et connaître la disponibilité des informations pas encore disponibles en ligne. Cela peut également aider à évaluer l’importance relative et la valeur des collections non numérisées et fixer des priorités pour de futures numérisations. Comme pour tous les jeux de données, le GBIF s’assure que chaque jeu de données "métadonnées seules" publié est associé à un unique DOI (Identificateur de Données Numériques) afin de rendre plus efficace la citation de ces ressources par les utilisateurs des données.

Listes taxonomiques

Les jeux de données peuvent également fournir un catalogue ou une liste de noms d'organismes ou de taxons. Même s’ils peuvent inclure des détails supplémentaires comme les noms communs et les citations des spécimens, ces listes taxonomiques ou référentiels classent généralement l’information par taxonomie, géographie et statut ou en combinant les trois. Par exemple, un jeu de données qui fait l’inventaire de la Liste Rouge des Mollusques des Seychelles comporte différents éléments de taxonomie (le phylum Mollusca), de géographie (la nation insulaire des Seychelles) et du statut (espèces considérées en péril par les experts de l’UICN). Les listes taxonomiques ou référentiels fonctionnent comme un bref résumé ou un inventaire de références des taxons dans un contexte donné.

Données d’occurrences d’espèces

D’autres jeux de données publiés par GBIF.org ont suffisamment de détails cohérents pour fournir des informations sur la localisation des organismes individuels dans le temps et l’espace, c’est-à-dire qu’ils offrent des preuves de la présence d’une espèce (ou d’un autre taxon) dans un endroit particulier à une date spécifiée. Ces ensembles de données constituent l’essence des données publiées via le site GBIF.org. Il peut s’agir par exemple de spécimens et fossiles de collections d’histoire naturelle, d’observations faites par des chercheurs sur le terrain ou par des citoyens scientifiques et de données issues des pièges photographiques ou des satellites de télédétection.

Les enregistrements d'occurrences dans ces jeuxs de données ne fournissent parfois que des informations générales sur la localité, identifiant parfois simplement le pays, mais dans de nombreux cas, des emplacements et des coordonnées géographiques plus précis permettent une analyse et une cartographie à échelle fine de la répartition des espèces.

Données d'échantillonnage

Parfois, les jeux de données fournissent de plus amples détails, mettant en évidence non seulement l’enregistrement d’une espèce à un endroit et une date donnée, mais également la possibilité d’évaluer la composition des communautés de groupes taxonomiques plus larges ou même l’abondance des espèces en plusieurs moments et lieux. Ces ensembles de données proviennent généralement des protocoles standards développés pour mesurer et suivre la biodiversité comme les transects, les comptages d’oiseaux ou les prélèvements d’eau de mer ou d’eau douce.

En indiquant les méthodes, les événements et l'abondance relative des espèces enregistrées dans un échantillon, ces ensembles de données améliorent les comparaisons avec les données collectées à l'aide des mêmes protocoles à différents moments et endroits - dans certains cas, amenant même les chercheurs à déduire l'absence d'espèces particulières sur des sites particuliers.