数据质量要求

发布者不仅在共享数据集方面发挥着重用作用,而且在管理数据集的质量、完整性和实用性以及确保其在GBIF全球知识库中的整合与价值方面也发挥着重要作用。

Ploceus-philippinus-iNat-Malay-Mehta
Male baya weaver (Ploceus philippinus) waits outside as a female inspects the nest he built from inside. Females baya weavers select mates on the basis of the quality of nest construction. Photo by Malay Mehta via iNaturalist Research-grade observations, licensed under CC BY-NC 4.0.

要通过GBIF.org共享数据,发布者通常需要将现有数据集整理或转换成一个标准化格式。 这项工作可能包括额外的处理、内容编辑和将一个数据集的内容映射为可用的数据传输格式之一,以及通过可用的数据发布工具之一进行发布,例如GBIF的免费、开源的集成发布工具包或IPT。

一旦发布,GBIF的实时基础设施“索引”或“获取”新数据集,将它们整合到一个通用访问系统中,使用者可以通过常用的搜索和下载服务检索任何和所有的数据。 当数据集被索引时,GBIF.org执行额外的检查、解释和转换程序,以确保数据是可互操作的,并复合数据格式数据质量和适用性的最低标准。 然而,许多关于数据质量和可用性的标准,在它们的源头(即单独数据集)处理时是最好也最容易解决的。

因而,发布者不仅在共享数据集方面发挥着重要作用,而且在管理数据集的质量、完整性和有用性以及确保数据集在GBIF全球知识库中的整合和价值方面也发挥着重要作用。 了解关于数据质量要求和建议的更多信息,为了

在实践中,我们鼓励负责发布数据的人员在发布过程中尽早熟悉预期的数据格式和内容要求(也可参见预配置的GBIF Excel模板,其中包含发生数据集检查表采样事件数据集所需和推荐的术语,所有这些都有示例数据)。 这样做会节省后期阶段可能需要的大量工作,例如,在添加数据转换时、在获取必填或强烈推荐字段的信息时,或在执行和处理最终的发布前数据质量检查时。