Skip to main content

    標準データ形式

    標準データ形式を共有することで、GBIFインデックスにおいて何億もの生物多様性情報の一次レコードを集めることに成功しました。

    <em>コカナダモ属</em> の細胞および葉緑体の<a href="https://flic.kr/p/bzNf9B">拡大写真</a>(著作者:<a href="https://www.flickr.com/photos/arwing3">Brandon Zierer</a>、ライセンス:<a href="https://creativecommons.org/licenses/by-nc-sa/2.0">CC BY-NC-SA 2.0</a>)

    GBIF.orgを通して利用可能なデータおよび関連サービスは、世界中の何百もの機関から引き出された何千もの異なるデータセットを記述し、記録し、構造化するための共有ルールおよび規則をGBIFネットワークの参加団体およびデータ発行者が適用してきたことによる成果です。共通の標準形式のおかげで、GBIFインデックスにおいて何億もの生物多様性情報の一次レコードを集めることに成功しました。

    生物多様性分野において、標準データ形式の開発および維持を主に担っている団体はBiodiversity Information Standardsです。この非営利な科学・教育協会は、International Union of Biological Scienceの関係団体として生物および生物多様性データ交換のための標準データ形式の開発に焦点を当てています。生物多様性コミュニティのメンバーはこの団体をTDWG(タドウィグと発音)と呼んでいます(団体の前身であるTaxonomic Databases Working Groupを思い起こす意味も込めて)。

    よく使われる標準形式

    ダーウィンコア

    ダーウィンコアスタンダード(DwC)は、多様で変化する情報源から生物多様性データを集める上で安定した、直接的で柔軟なフレームワークを提供します。GBIF.orgで共有されているデータセットの多くはダーウィンコアアーカイブフォーマット(DwC-A)を用いて出版されています。

    ダーウィンコアとは何ですか?なぜ重要なのですか?
    サンプリングイベントデータの紹介
    iOBISダーウィンコアマニュアル
    ダーウィンコアの用語(Gcube Wiki経由)

    EML:生態学メタデータ言語

    生態学メタデータ言語またはEMLとは、生態学分野のデータセットに関する情報を記述するためのメタデータ標準であり、モジュール式で拡張されたXMLドキュメントタイプの一つです。GBIF.orgにおけるデータセットの全ての記述はメタデータに準拠しています。メタデータとはデータについての情報で、The Knowledge Network for Biocomplexityにより維持管理されているオープンソースのEML標準形式を使用しています。ダーウィンコアアーカイブは構成ファイルの一つとして(EML形式で記述された)EMLファイルを含みます。

    GBIFメタデータプロファイル:ハウツーガイド
    EML標準形式

    BioCASe / ABCD

    Biological Collection Access Serviceは、一般的にはBioCASeと呼ばれ、自然史博物館、植物園、動物園および研究機関から集められた生物コレクションデータをつなぐ国際ネットワークです。BioCASeは同じくTDWGが管理するAccess to Biological Collections Data (ABCD) data exchange standardに準拠しています。

    BioCASeプロトコル
    GBIF.orgを介したBioCASeデータへのユーザのアクセス状況