Les différents types de jeu de données

Les quatre types de jeu de données supportées par le GBIF, du plus simple au plus sophistiqué (plus riche, plus structuré mais aussi plus complexe)

Biodiversity
Biodiversity by RayMorris1 licensed under CC BY-NC-ND 2.0.

Les quatre types de jeu de données supportées par le GBIF sont simples au début, mais deviennent progressivement plus riches, mieux structurées et plus complexes.

Nous encourageons les détenteurs de données à publier les données les plus riches possibles pour assurer leur utilisation dans le plus large éventail d’approches et questions scientifiques. Toutefois, tous les jeu de données ne possèdent pas les mêmes niveaux de précision. Partager tout ce qui peut l’être via le site GBIF.org est important, car même une information partielle peut apporter des réponses à d’importantes questions.

Métadonnées seules

A son niveau de base, GBIF.org permet aux institutions de créer des jeux de données décrivant des ressources non numériséesées telles que celles des collections d’histoire naturelle par exemple. Les trois autres types d’ensemble de données comportent cette information de base, mais ce type de ‘métadonnées seules’ offre aux chercheurs un outil précieux pour découvrir et connaître la disponibilité des informations pas encore disponibles en ligne. Cela peut également aider à évaluer l’importance relative et la valeur des collections non numérisées et fixer des priorités pour de futures numérisations. Comme pour tous les jeux de données, le GBIF s’assure que chaque jeu de données “métadonnées seules” publié est associé à un unique DOI (Identificateur de Données Numériques) afin de rendre plus efficace la citation de ces ressources par les utilisateurs des données.

Listes taxonomiques

Les jeux de données peuvent également fournir un catalogue ou une liste de noms d’organismes, ou taxons. Même s’ils peuvent inclure des détails supplémentaires comme les nom communs et les citations des spécimens, ces listes taxonomiques ou référentiels classent généralement l’information par taxonomie, géographie et statut ou en combinant les trois. Par exemple, un jeu de données qui fait l’inventaire de la Liste Rouge des Mollusques des Seychelles comporte différents éléments de taxonomie (le phylum Mollusca), de géographie (la nation insulaire des Seychelles) et du statut (espèces considérées en péril par les experts de l’UICN). Les listes taxinomiques ou référentiels fonctionnent comme un bref résumé ou un inventaire de références des taxons dans un un contexte donné.

Les données d’occurrence d’espèces

D’autres jeux de données publiés par GBIF.org ont suffisamment de détails cohérents pour fournir des informations sur la localisation des organismes individuels dans le temps et l’espace - c’est-à-dire qu’ils offrent des preuves de la présence d’une espèce (ou d’un autre taxon) dans un endroit et une date donné. Ces ensembles de données constituent l’essence des données publiées via le site GBIF.org. Il peut s’agir par exemple de spécimens et fossiles de collections d’histoire naturelle, d’observations faites par des chercheurs sur terrain ou par des citoyens scientifiques, et de données issues des pièges photographiques ou des satellites de télédétection.

Les occurences figurants dans ces jeux de données peuvent quelquefois ne fournir que des informations générales sur les localités, et parfois juste pour identifier le pays. Mais dans de nombreux cas, ces ensembles de données donnent de plus amples précisions sur les lieux et des coordonnées géographiques pour appuyer une analyse poussée et une cartographie de la distribution des espèces.

Données d’échantillonnage

Parfois, les jeux de données fournissent de plus amples détails, mettant en évidence non seulement l’enregistrement d’une espèce à un endroit et une date donnée, mais également la possibilité d’évaluer la composition des communautés de groupes taxonomiques plus larges ou même l’abondance des espèces en plusieurs moments et lieux. Ces ensembles de données proviennent généralement des protocoles standards développés pour mesurer et suivre la biodiversité comme les transects, les comptages d’oiseaux ou les prélèvements d’eau de mer ou d’eau douce. En indiquant, lors d’un échantillonnage, les méthodes, événements et l’abondance relative des espèces enregistrées, ces ensembles de données améliorent les comparaisons pouvant être faîtes avec des données collectées en utilisant les mêmes protocoles à différents endroits et moments - dans certains cas, cela permet aux chercheurs d’en déduire l’absence d’espèces particulières sur des sites spécifiques.


Nos remerciements à Pierre Radji, GBIF Togo, Sophie Pamerlon, GBIF France et Nicolas Noé, Belgian Biodiversity Platformpour le soutien de la traduction