之于生物多样性的大数据:“全球生物多样性信息网络”平台(GBIF.org)已有逾十亿种物种数据发生记录

于实现的里程碑代表了一项集体的努力:有123个国家1200多个机构共享地球生物多样的证据-其中还包括全球100多万研究人员和公民科学家的参与。

Metridium_dianthus- BGuichard-120583
Frilled anemone (Metridium dianthus). Photo by B. Guichard, Agence Française pour la Biodiversité, licensed under CC BY-NC-SA 4.0

由于法国国家自然遗产名录清单(l’Inventaire National du Patrimoine Naturel)数据集激增的贡献,GBIF.org平台在2018年7月4日突破了10亿种物种发生记录的大关,其中包括对位于大西洋西北部法国群岛圣-皮埃尔和密克隆沿岸褶边海葵(Metridium dianthus,须毛细指海葵)的观察。对这种海洋无脊椎动物的记录,是通过BioObs (之于水下观测清单的基础)收集到的150,097条数据之一。作为一种公民科学工具,BioObs使潜水员能够了解海洋环境,同时为收集国家的水下物种数据清单做出贡献。

该里程碑意味着一项重大的集体成就,并通过GBIF网络实现了一个目标,那就是一个由出自123个国家的1,200多个公共和私人机构共同构成的多元化合作伙伴关系。并且,GBIF的全球指数和基础研究设施还能够随时随地为所有人免费提供关于地球上生物相关地点和时间的数据。

Read the original news item in English

这些数据的来源,凝聚着全球100多万生物学家、实地科研人员、IT专业人士、藏品策展人、生物多样性信息学家和数据科学家们的多年的参与成果与贡献,GBIF.org平台正是通过对他们观测结果的记录,使得全社会和公民科学家能够共享这一成果。

GBIF.org平台记录数据的持续增长,也反映了这一平台对物种覆盖率和物种多样性的稳定增长——这一趋势也体现了该平台对填补已知物种的分类、地理和时间差距的愈加重视。截至2018年4月,GBIF.org平台上涉及1,049,839种物种,占被最新审查的生命物种目录清单中的62%。

GBIF的全球发生记录的索引,通过支持“大数据”分析,为科学研究和政策的信息支持提供了无与伦比的证据基础。平均而言,每天会生成将近两份同行评审的研究论文,它们都依赖于通过GBIF.org访问的数据。例如,阐明地球的进化史,或生成模型以找到对影响地球生命条件快速变化的解释。然而,搜索结果不仅限于对物种保护、保护地或外来物种和入侵物种风险的研究和管理——它们还可以挖掘如何保护和重要作物有关的野生植物来改善粮食安全、到哪里可以对一些携带致人类感染病菌的动物的分布变化情况进行监测,以及大自然为人类社区提供的利益和服务取决于生物多样性的原因等。

“过去15年来,数十个国家政府的投资使得GBIF网络能够建立一个高性能的平台来自由、公共和公开地共享生物多样性数据,”南非国家生物多样性研究所(SANBI)创始首席执行官,同时也是GBIF现任理事会主席的Tanya Abrahamse博士说。“但同样重要的是,基础设施配备了一个高效的全球实践社区。参与GBIF洲际合作的个人慷慨地转移他们的技能和知识,以便能够更广泛地获取与地球生命有关的数据。”

在GBIF.org近期快速增长的基础上,最近正在进行的对网络底层技术平台的改进已经产生了一个高容量、近乎实时的基础设施【链接】,以便在未来几年内提供更多、更丰富的生物多样性信息。GBIF.org的用户在2017年下载了超过8,450亿条记录——较之前一年的数据增加了200%,使得这些增强功能得到了及时的印证。GBIF完全预计这一总数将在2018年超过1万亿大关,这是基础设施成熟度的另一个标志。

GBIF的全球基础设施使研究人员能够从全球数百个收集和数据库中搜索获取信息,从而为他们节约宝贵的时间,实现更高的效率。社区本身也通过把劳动力投入到开放源码的数据共享和访问工具中,提供越来越重要的服务,例如 生活地图集平台Living Atlases platform,最初为澳大利亚政府开发,目前覆盖世界各地,正在几十个国家使用或开发中。

“如果我们想要解决之于未来将要面对的土地使用、保护、气候变化、粮食安全和健康方面的重大挑战,我们需要有效的方法将所有能够帮助我们了解世界变化状况的数据,以及生物多样性在各种尺度发挥的重要作用汇集在一起。”GBIF执行秘书Donald Hobern说。“这个里程碑显示,当今的GBIF网络已经为持续增长做好了准备,并准备好处理我们期望从其它新技术和来源获取的大量数据,包括环境排序和遥感。”

虽然达到10亿条记录是一个重要的里程碑,但是仍有许多工作要做,包括扩大连接尚未通过GBIF网络连接的生物多样性数据来源所需的伙伴关系。为此,GBIF.org提供了一个现成的框架,帮助各个国家和机构填补生物多样性信息在地理、时间和生物分类方面的差距和偏见。

博物学家、探险家和科学家们已经记录了几个世纪以来世界各地的生活。通过GBIF网络提供的开放式生物多样性数据,可以回收有关从野外考察和世界各地的自然历史藏品中收集的物种证据,通过数字访问将其解锁,供包括来源国在内的全世界研究人员和公民使用。

在GBIF.org平台上使用标准化数据格式和许可证【链接】消除了对共享和使用开放式生物多样性数据条款的猜测和不确定性。全球索引还包含一个先进的系统,将研究中正确引用的数据示例 与支持它的数据集示例相连接,从而确保共享数据的机构(示例为其行为获得信用。GBIF也继续支持和倡导数据文件作为一种工具,以确保研究人员获得公认的学术信用,以便在工作中收集、策划和分享可免费访问、互操作和重复使用的数据。