Standardy zbiorów danych

Ujednolicone standardy są głównym czynnikiem umożliwiającym zebranie setek milionów podstawowych zapisów różnorodności biologicznej w indeksie GBIF.

Detail of *Elodea*
Macrophotograph of Elodea cells and chloroplast by Brandon Zierer. Licensed under CC BY-NC-SA 2.0.

Dane dostępne za pośrednictwem GBIF.org i powiązanych z nią usług są wynikiem pracy członków i wydawców stosujących wspólne zasady i konwencje opisu, rejestracji i organizacji zbiorów danych pochodzących z setek instytucji na całym świecie. Ujednolicone standardy są głównym czynnikiem umożliwiającym zebranie setek milionów podstawowych zapisów różnorodności biologicznej w indeksie GBIF.

W dziedzinie różnorodności biologicznej, grupą odpowiedzialną za opracowywanie i utrzymywanie standardów danych jest Biodiversity Information Standards. Jako partner International Union of Biological Sciences, to naukowe i edukacyjne stowarzyszenie non-profit koncentruje się na opracowaniu standardów wymiany danych w zakresie biologii i różnorodności biologicznej. Członkowie społeczności różnorodności biologicznej powszechnie odnoszą się do tej grupy jako TDWG (wymawiane tad-łig). Jest to pozostałość po jej wcześniejszym wcieleniu: "Taxonomic Databases Working Group".

Powszechnie stosowane standardy

Darwin Core

Standardy Darwin Core (DwC) zapewniają stabilny, wszechstronny i prosty w użyciu szablon do gromadzenia danych o różnorodności biologicznej ze zróżnicowanych źródeł. Większość zbiorów danych udostępnionych za pośrednictwem GBIF.org jest publikowana przy użyciu formatu Darvin Core Archive (DwC-A).

EML: Język Metadanych Ekologicznych

Język Metadanych Ekologicznych, lub EML, jest standardem metadanych, który rejestruje informacje o zbiorach danych ekologicznych w serii modularnych i rozszerzalnych dokumentów typu XML. Wszystkie opisy zbiorów danych w GBIF.org opierają się na "metadanych" - t.j. informacjach o danych. Używany jest open source standardu EML, zarządzanego i utrzymywanego przez The Knowledge Network for Biocomplexity. Każdy Darwin Core Archive zawiera plik EML (zapisany w formacie XML) jako jeden ze swoich elementów.

BioCASe / ABCD

Biological Collection Access Service, powszechnie znany pod nazwą BioCASe, jest międzynarodową siecią łączącą ośrodki badawcze ze zbiorami danych dotyczących różnorodności biologicznej pochodzących z muzeów historii naturalnej oraz ogrodów botanicznych i zoologicznych. BioCASe bazuje na stadardzie wymiany danych "Access to Biological Collections Data" (ABCD) administrowanym przez TDWG.