生物多樣性的大數據:全球生物多樣性機構(GBIF)物種出現紀錄超過十億筆

在2018年7月4日達成的這項里程碑,代表全球123個國家中超過1200個機構、一百萬位研究者與公民科學家在分享全球生物多樣性紀錄上的集體成就

Metridium_dianthus- BGuichard-120583
Frilled anemone (Metridium dianthus). Photo by B. Guichard, Agence Française pour la Biodiversité, licensed under CC BY-NC-SA 4.0

全球生物多樣性資訊機構的開放資料平台(GBIF.org)資料量在 2018 年 7 月 4 日突破 10 億筆!帶領跨越此一重要里程碑的資料集來自於法國國家自然史遺產典藏機構(l’Inventaire National du Patrimoine Naturel),其中包含法國在北大西洋聖皮耶及密克隆(Saint-Pierre and Miquelon)半島的褶邊海葵(Metridium dianthus) 觀測紀錄。這筆海洋無脊椎動物的資料是透過「水下觀測清單依據」(Base pour l’Inventaire des Observations Subaquatiques, BioObs)取得的 150,097 筆紀錄之一。「水下觀測清單依據」是一個協助潛水人員瞭解海洋環境及貢獻國家水下物種調查的公民科學工具。

近幾年,超過一百萬人透過GBIF.org分享他們參與紀錄社會與公民科學計畫的觀察資料,為生物學家、野外研究者、資訊科技專家、資料蒐集管理人、生物多樣性資訊學家與數據科學家們的長期貢獻注入一股新助力。

以GBIF為代表,持續增長的物種出現紀錄也展現出了物種囊括的比例及物種多樣性的穩定增加,這樣的趨勢反映了整個網絡對填補已知的分類群在地理與時間上的空缺重視的程度持續增加。截至2018年4月為止,GBIF.org有著一份至少紀錄著1,049,839種物種的名錄,約含最新版物種名錄記錄中的62%。

透過提供大數據分析,GBIF的全球物種出現指標為研究與公眾政策提供了一個絕佳的佐證基礎。平均來說,每天會有將近兩篇經同儕審查的研究論文是透過GBIF.org取得資料的,例如,為了解釋地球演化的歷史或為理解環境快速變遷對地球上生命的衝擊所建立的模式等。然而,這些資訊並不限於物種保育、保護區、外來與入侵種的風險相關的研究與管理─研究者們探索了如何透過保育重要作物的野外族群加強糧食安全、何處是攜帶可傳人疾病動物分佈變化的重點監測區域、以及為何自然憑藉著生物多樣性提供人類各式的好處與服務。

「藉由數十個國家在過去15年來的投入,使GBIF網絡得以推出一個能自由地、公眾地、開放地分享生物多樣性資料的高效能平台。」南非生物多樣性研究所創始執行長、現任GBIF理事會主席─譚雅‧亞伯拉罕說。「但同等重要的是,這樣的基礎設施成為一個高效能且全球性的實例。參與GBIF洲際合作的人們慷慨地提供他們所有的技能或知識,使地球上所有生命的資料得以被更廣泛地取用。」

網路基礎技術平台近期不間斷的進步,已創造出一個大量、近乎實時的基礎設施,並準備好在近期GBIF.org的快速成長中實裝,以在未來幾年中提供更加大量、豐富的生物多樣性資訊。有鑑於GBIF.org的使用者在2017年下載了超過8450億筆記錄─比起前年的下載量增加了200%,證明這樣的改進是即時的。GBIF預期下載量會在2018年超越一兆大關,這是另一個基礎設施已成熟的象徵。

GBIF的全球性基礎設施使研究人員可以有效率且省時省資源地在全球數百個收藏與資料庫中搜尋資料。研究社群也藉由投入開發可分享與存取資料的開源工具而提供了日益重要的服務,例如Living Atlases platform,原本是為了澳洲政府而建立的,但現今已在全球各地的數十個國家中發展。

擔任GBIF執行秘書的唐納德‧赫本(Donald Hobern)說:「如果我們想解決未來將面對的土地利用、保育、氣候變遷、糧食安全與健康等巨大挑戰,我們需要將有助於了解世界變動狀況,及各尺度下生物多樣性扮演的關鍵角色之資料有效整合的方法。這項里程碑顯示現今的GBIF已準備好繼續成長並處理我們預期將自其他來源或科技取得的巨量資料,包括環境基因體學和遙測。」

雖然達到十億筆記錄資料是個重要的里程碑,但仍有許多工作有待完成,包含與尚未和GBIF網分享生物多樣性資料的來源發展夥伴關係。為此,GBIF.org準備了現成的合作框架,以協助國家與組織填補生物多樣性資訊中那些跨地理、時間與分類上的空缺與偏差。

博物學家、探險者與科學家在世界各地記錄生物已有數世紀的歷史。透過GBIF網路提供開放的多樣性資料,將自野外探險與全球自然史收藏所獲得的物種資料,以數位化的方式,提供給全球的研究者、公民,也包括資料的來源國。

GBIF.org使用的標準資料格式與授權消除了在分享與使用開放性生物多樣性資料時的猜測與不確定性。在全球性的指標中還包含一個先進系統,此系統會將研究所引用的數據example正確地連結到支持的資料集example,藉此確保分享資料的機構example留下做出貢獻的紀錄。GBIF也將持續地提倡資料文獻,作為保障研究者收集、整理與分享可自由獲取、相互操作並重複使用之資料時,能獲得公認學術信譽的工具。