什么是达尔文核心?它为什么重要?

达尔文核心标准 (DwC) 提供了一个稳定、直截和灵活的框架,用于整合各种不同来源的生物多样性数据。

Platyspiza crassirostris
Platyspiza crassirostris by Brian Gratwicke licensed under CC BY 4.0.

自然历史收藏、环境监测计划、记录协会、公民科学家项目等都拥有关于世界生物多样性的宝贵数据。 他们收集和管理不同的系统和环境中的信息,各个数据集收集和存储哪些信息也有所差异,造成这些数据集之间差异很大

因此,我们应该如何用最简单、最有效的方式来整合这些各异的数据集,以便科学家、分析员和决策者能够在科研和政策制定时使用这些数据集?

达尔文核心标准(DwC)提供了一个稳定、直接和灵活的框架,用于汇编出自不同和可变来源的生物多样性数据。 达尔文核心[最初是由生物多样性信息标准(TDWG) 社区开发的,是一个不断发展的社区开发的生物多样性数据标准](http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0029715)。 它在分享方面发挥着重要作用。 生物多样性数据的使用和再利用以及今天的开放准入生物多样性数据占了通过基于生物技术的全球框架提供的数亿物种发生记录的绝大多数。 毫克

实际上,使用达尔文核心围绕标准文件格式,即达尔文核心档案(DwC-A)。 这个紧凑的软件包(ZIP文件) 包含相互关联的文本文件,并使数据发布器能够使用一个共同的术语共享他们的数据。 这种标准化不仅简化了公布生物多样性数据集的过程,而且使用户容易发现, 在数据集寻求当今数据密集型研究和政策问题的答案时,对它们进行搜索、评估和比较。

其他资源

档案中有什么?

当从他们的源数据准备达尔文核心档案版本时,发布者将信息重组并简化为一个小型但结构化的文本文件集合。 其中一个文件是“核心”文件,它为存档中包含的每个项目保存单独记录。 其他“扩展”文件也可能包括在内。 这些包含链接到核心文件中记录的附加信息。 扩展文件允许存档对多对一的关系进行建模。

根据源数据包含的信息量以及他们希望共享的信息量,发布者可以使用以下三种核心之一创建达尔文核心档案:

  • 分类系统核心,列出了一组物种,通常来自同一地区或具有共同特征
  • 出现核心,列出了记录特定物种的一组时间和地点
  • 事件核心,其中列出了现场研究(包括使用的协议、样本量和每个的位置)。

对于事件核心,一个扩展文件通常包含发生核心中显示的元素,这使得许多观察记录可以作为单个计划现场研究的一部分包含在内。

最后,每个档案都包含另外两个部分,可以帮助机器和人类解释数据。 第一个是描述符文件(meta.xml),定义了核心扩展与任何扩展之间的准确结构和关系。 第二个是一个补充元数据文件,描述了存档中包含的数据集,通常使用生态元数据语言(EML.xml) -通过GBIF的“集成发布工具包”自动为用户生成这些文件。

与事件核心共享物种监测和采样数据

追踪生物多样性模式随空间和时间变化的努力增加了通过采样和监测计划可获得的物种信息量。 除了具有比“仅存在”数据更精确的描述方法之外,这些基于样本的数据集还捕捉到关于物种数量和发生次数的更丰富、更复杂的细节。

生态和环境调查中的采样事件数据经常包含出自同一地点的重复测量数据,因此可以更好地检测物种种群的变化和趋势,对了解全球变化的范围和速度至关重要。

但是,为了帮助充分利用这些多样化的数据,并确保它们对更精确的科学分析和政策成果的有效贡献,研究人员需要以一种一致的、兼容的格式方便地获取这些数据。

达尔文核心标准已成为使用最广泛的生物多样性数据开放获取标准。 该标准旨在提供一种简单的方法来记录和共享物种出现的信息,无论是在野外还是在博物馆收藏中,该标准使得GBIF.org整合数以亿计的记录成为可能。

达尔文核心(Darwin Core)最近新增的功能支持采样事件数据集的汇总,详情如下。 新引入的 "事件核心 "将采样事件置于简化数据集的中心,并将其协议、努力和测量结果与采样事件中的物种出现情况联系起来,这些物种出现情况在标准的一对多星形模式中作为一个单独的扩展项进行附加。

因此,研究人员现在可以利用更复杂、定量更丰富的记录进行分析,并将它们与其他侧重于单一生物或单个类群的记录结合起来。 这些变化甚至可以提高已经在基于性别的综合框架上公布的数据集的质量和用处。 rg源自更为复杂的调查和普查。

希望混合这些不同的数据来源,而不是限制或规定其用途。 • 鼓励发现和再利用这些记录——或许甚至揭示从审查个人记录中看不出的更高层次的关系和洞察力。

一切是如何开始的

准备和发布基于达尔文核心的数据集最有效的方法是通过 GBIF 的 Integrated Publishing ToolkitEU BON 和其他合作伙伴为支持这一新类别的数据集所需的变革做出了重要贡献。 拥有持续监测方案和取样项目的数据持有者也可以在使用多种语文的IPT上自动配置预定出版周期。

DwC-A活动核心中的新功能

达尔文核心标准增加了“事件核心”包括几个新的术语,这些术语非常适用于取样和监测数据。

  • 事件:数据集中事件的标识符
  • 父事件ID:组事件的标识符
  • 采样协议:取样活动中使用的方法或协议
  • 样品大小值:取样活动中样品大小(长度、长度、面积或体积) 的数值。 必须有相应的采样Size单元
  • 采样SizeUnit: 尺寸的测量单位 (sampleSizeValue)
  • 生物数量:生物数量的一个数字。 必须有相应的生物数量类型
  • organismQuantityType: 用于生物数量的量化系统类型