データセットの種類

GBIFでサポートされている4つの種類のデータセットには簡単なものから、徐々に情報が多く、より構造化され、より複雑なものまであります。

※訳注:種類は原文では「class」ですが、ダーウィンコアにも分類学にもclassという用語が使われているため、ここでは「種類」と訳しました。

Biodiversity
Biodiversity by RayMorris1 licensed under CC BY-NC-ND 2.0.

GBIFでサポートされている4つの種類のデータセットには簡単なものから、徐々に情報が多く、より構造化され、より複雑なものまであります。

※訳注:種類は原文では「class」ですが、ダーウィンコアにも分類学にもclassという用語が使われているため、ここでは「種類」と訳しました。

データ保有者には、より広い範囲の研究アプローチや質問に使用できるように、より豊富なデータを公開することが推奨されますが、すべてのデータセットが同じレベルの情報をもっているわけではありません。しかし、部分的な情報であっても、重要な質問に答えることができる場合があるので、入手できる情報をGBIF.orgで共有することは有益です。

リソースメタデータ

最も単純なレベルとして、GBIF.orgでは、自然史やその他のコレクションのようなデジタル化されていないリソースについてのデータセットを作成することができます。他の3つのデータセットの種類はすべてこの基本情報を含んでいますが、この「メタデータのみ」のデータセットは、オンラインではまだ入手できない状況であるとは言え証拠を発見して学ぶ上で貴重なツールとなります。また、デジタル化されていないコレクションの相対的重要性と価値を評価し、将来デジタル化するための優先順位を設定するのに役立ちます。GBIFでは全種類のデータセットについて、データユーザーによるリソースの引用を効率化するため、各メタデータのデータセットが固有のデジタルオブジェクト識別子(DOI)に関連付けられているようにしています。

チェックリストデータ

名前がついている生物または分類群について、カタログまたはリストをデータセットとして提供することもできます。和名や標本引用などの追加の詳細情報も含めることができますが、これらの「チェックリスト」は通常、分類学的、地理的、テーマ別の情報、またはこれら3つを組み合わせた情報を整理します。例えば、セイシェルの軟体動物の絶滅危惧種をカタログ化したデータセットは、分類(軟体動物門)、地理学(セイシェル共和国)、テーマ(IUCNの専門家によって危機に瀕しているとされる種)という個別要素からなります。チェックリストは、与えられた状況下における分類群の簡潔な要約または基盤的インベントリとなります。

オカレンスのみのデータ

※訳注:GBIFの文脈では生物がある場所に存在することを「occurrence」といいます。しかし、これに適した訳語はありません(強いて言えば、「発生」や「分布」が近い)。そのため、そのままカタカナ読みをあてている。

GBIF.orgで公開されている他のデータセットは、時空間における個々の生物の位置に関して一貫性のある十分な詳細情報を持っています。つまり、特定の日付に特定の場所に種(または他の分類群)が存在した証拠を示します。発生データセットはGBIF.orgで公開されているデータの中核をなし、自然史コレクションにおける標本と化石に始まり、フィールドの研究者と市民科学者による観測データ、カメラトラップやリモートセンシング衛星から収集されたデータなどがあります。

これらのデータセットのオカレンスレコードは、時には一般的な地域情報(時には国のみ)を提供するだけですが、多くの場合は、より正確な場所や地理的座標を提供することによって種分布の詳細な分析とマッピングが行えます。

サンプリングイベントデータ

データセットによっては、時として特定の場所と日付での種のオカレンスの証拠を提供するだけでなく、より高次の分類グループでの群集組成や複数の時間や場所における種のアバンダンスの評価が可能になります。これらの定量的データまたはサンプリングイベントのデータセットは、典型的には、植生のトランセクト、鳥類のセンサス調査、淡水または海洋のサンプリングなどの生物多様性の測定およびモニタリングの標準的なプロトコルによって得られます。

データの取得方法、イベント、一つのサンプル中に記録された種の相対的なアバンダンスを示すことによって、これらのデータセットは、別な時間および場所で同じプロトコルを用いて収集されたデータと比較しやすくなります――時には、特定の場所における特定の種の不在を明らかにすることが可能になります。