数据集类型

GBIF支持的四类数据集从简单的开始,并逐渐变得更丰富、更结构化和更复杂

Biodiversity
Biodiversity by RayMorris1 licensed under CC BY-NC-ND 2.0.

我们鼓励数据持有者尽可能发布最丰富的数据,以确保它们在更广泛的研究方法和问题中的使用,但并非每个数据集都包含相同详细程度的信息。 通过GBIF.org分享可用信息是有价值的,因为即使是部分信息也回答了一些重要的问题。

下面是对GBIF目前支持的四类数据集的描述。

资源元数据

在最简单的层面上,GBIF.org 允许机构创建数据集,描述如自然历史和其他收藏中的未数字化资源。 所有其他三个数据集类别都包含这些基本信息,但这个 "纯元数据 "类别为研究人员提供了一个发现和了解尚未在线提供的证据的宝贵工具。 它们还有助于评估未数字化藏品的相对重要性和价值,并确定未来数字化的优先事项。 与所有数据集一样,GBIF确保每个元数据集都与唯一的数字对象标识符(DOI)相关联,以简化数据用户对这些资源的引用。

名录数据

数据集还可以提供命名生物体或分类群的目录或列表。 尽管它们可能包括当地物种名称或标本引用等详细信息, 这些“名录”通常按分类、地理和主题线或三者的部分结合进行信息分类。 例如,一套编目塞舌尔软体动物红色名录的数据集有清晰的分类元素(软体动物门),地理(塞舌尔岛国)和主题(自然保护联盟专家认为濒危的物种)。 名录可以作为特定环境下分类群的快速汇总或基准库存。

出现记录数据

通过GBIF.org发布的其他数据集有足够一致的详细信息,可以提供个别生物在时间和空间上的位置信息,即它们提供了在某一物种(或其他分类)在特定日期于特定地点出现的证据。 发生记录数据集构成了通过GBIF.org发布的数据的核心,示例范围包括自然历史馆藏中的标本和化石、野外研究人员和公民科学家的观测,以及从相机陷阱或遥感卫星收集的数据。

这些数据集中的出现记录有时只提供一般的地点信息,有时只标明国家,但在许多情况下,更精确的位置和地理坐标有助于精细的分析和物种分布的制图。

采样活动数据

数据集有时能提供更详细的信息,不仅证明某一物种在特定地点和日期出现过,还能够为更广泛的分类组评估群落组成,甚至多个时间和地点的物种丰度。 这些定量或采样活动数据集通常来自于测量和监测生物多样性的标准规程,如植被横断面、鸟类普查以及淡水或海洋采样。

这些数据集标明了样本记录的方法、采样活动和物种的相对丰度,有助于与不同时间和地点使用相同标准规程收集的数据进行比较——在某些情况下,甚至对研究人员推断特定地点不存在特定物种起导向作用。