Estándares de datos

Los estándares de datos son la pieza principal que permite unificar en GBIF cientos de millones de registros primarios de biodiversidad.

Detail of *Elodea*
Fotografía macro de células y cloroplastos de Elodea. Brandon Zierer. Bajo licencia CC BY-NC-SA 2.0.

Los datos disponibles a través de GBIF.org y sus servicios asociados son el resultado de una red de participantes y publicadores que utilizan un lenguaje común para describir, registrar y estructurar miles de juegos de datos muy diversos y procedentes de cientos de instituciones de todo el mundo. El uso de estándares comunes es el mecanismo principal para reunir los cientos de millones de registros primarios de biodiversidad en GBIF.

Dentro del contexto de la biodiversidad, uno de los grupos más activos en el desarrollo y mantenimiento de estándares de datos es el de Biodiversity Information Standards (Estándares para la Información de la Biodiversidad). Como afiliado de la International Union of Biological Science (Unión Internacional de Ciencias Biológicas), esta asociación científica y educativa sin ánimo de lucro se enfoca en el desarrollo de estándares para el intercambio de datos biológicos y de biodiversidad. Los miembros de la comunidad de la biodiversidad generalmente se refieren a este grupo como TDWG (pronunciado tad-wig)- un recordatorio de sus órigenes como Taxonomic Databases Working Group.

Estándares más usados

Darwin Core

El estándar Darwin Core Standard (DwC) ofrece un marco estable, sencillo y flexible para recopilar datos de biodiversidad procedentes de diferentes fuentes. La mayoría de los juegos de datos compartidos a través de GBIF.org se publican utilizando el formato Darwin Core Archive (DwC-A).

EML: Ecological Metadata Language

Ecological Metadata Language (Lenguaje de Metadatos Ecológicos), o EML, es un estándar de metadatos que recoge información sobre juegos de datos ecológicos en una serie de documentos XML modulares y extensibles.

Todas las descripciones de los juegos de datos alojados en GBIF.org se basan en ‘metadatos’— es decir, la información sobre los datos — y utilizan el estándar EML de código abierto, que administra y mantiene The Knowledge Network for Biocomplexity. Cada Darwin Core Archive incluye como uno de sus componentes un archivo EML (escrito en formato XML).

BioCASe / ABCD

El Biological Collection Access Service (Servicio de Acceso a Colecciones Biológicas), comúnmente conocido como BioCASe, es una red internacional que vincula datos de colecciones biológicas de museos de historia natural, jardines botánicos / zoológicos e instituciones de investigación. BioCASe se basa en el estándar de intercambio de datos de Access to Biological Collections Data (ABCD) (Acceso a Datos de Colecciones Biológicas), que TDWG también administra.