Standards de données

Les standards de données partagés permettent de réunir des centaines de millions d’enregistrements primaires sur la biodiversité dans l’index du GBIF.

Detail of *Elodea*
Photographie macro de cellules et de chloroplastes d'Elodea de Brandon Zierer. Sous licence CC BY-NC-SA 2.0.

Les données disponibles sur GBIF.org et les services associés résultent de l’adoption par le réseau des participants et des éditeurs de données de règles de partage et de conventions. Celles-çi permettent de décrire, d’enregistrer et de structurer des milliers de jeux de données différents préparés par des centaines d’institutions dans le monde. Les standards de données partagés permettent de réunir des centaines de millions d’enregistrements primaires sur la biodiversité dans l’index du GBIF.
Dans le domaine de la biodiversité, le groupe communément responsable de développer et de maintenir les standards de données est le Biodiversity Information Standards. En tant qu’affilié de l’International Union of Biological Science, cette association scientifique et éducative à but non lucratif se concentre sur le développement de standards pour l’échange de données biologiques et de biodiversité. La communauté de biodiversité le nomme encore souvent TDWG(prononcé tad-wig)- un reliquat de son appelation antérieure: Taxonomic Databases Working Group.

Les standards fréquement utilisés

Darwin Core

Le standard Darwin Core (DwC) offre un cadre stable, simple et flexible pour la compilation des données sur la biodiversité provenant de sources variées et variables. La majorité des jeux de données partagés via GBIF.org sont publiés sous le format Darwin Core Archive (DwC-A).

EML: Ecological Metadata Language

Le langage de métadonnées écologiques, ou EML, est un standard de métadonnées qui enregistre des informations sur les jeux de données écologiques dans une série de documents XML modulaires et extensibles. Toutes les descriptions de jeux de données dans GBIF.org reposent sur des «métadonnées», c’est-à-dire les informations sur les données, à l’aide du standard EML. Ce standard open source est administré et géré par le Knowledge Network for Biocomplexity. Chaque archive Darwin Core inclut dans ses composants un fichier EML (écrit au format XML).

BioCASe / ABCD

Le service d’accès à la collection biologique, communément appelé BioCASe, est un réseau international reliant les données de collections biologiques provenant de musées d’histoire naturelle, de jardins botaniques / zoologiques et d’instituts de recherche. BioCASe s’appuie sur le standard d’échange de données ABCD (Access to Biological Collections Data), que le TDWG administre également.