データに求められる品質

出版者は、単にデータセットを共有するだけでなく、その品質、完全性、有用性を管理し、GBIFの世界的な知識ベース内においてデータセットの統合性と価値を確保するという極めて重要な役割を果たしています。

Ploceus-philippinus-iNat-Malay-Mehta
Male baya weaver (Ploceus philippinus) waits outside as a female inspects the nest he built from inside. Females baya weavers select mates on the basis of the quality of nest construction. Photo by Malay Mehta via iNaturalist Research-grade observations, licensed under CC BY-NC 4.0.

GBIF.orgを通じてデータを共有する際、出版者は通常、現在あるデータセットを標準フォーマットと照合または変換する必要があります。この作業には、追加的な処理、コンテンツの編集、データセットのコンテンツを利用可能なデータ転送形式の1つへマッピングすることがあり、また、GBIFの無料オープンソースであるIntegrated Publishing Toolkit(IPT) などの利用可能なデータ出版ツールを介して出版することも含まれます。

一度出版されると、GBIFのインフラストラクチャがリアルタイムで新しいデータセットの「インデックス作成」や「収集」を行い、共通のアクセスシステムに統合します。このシステムでは、共通の検索とダウンロードのサービスにより、ありとあらゆるデータを検索できます。データセットのインデックスが作成されると、GBIF.orgは、追加のチェック、解釈、変換の作業を行い、データが相互利用可能かどうか、またデータの形式データの品質 、使用適合性が最低限の基準を満たしているかどうかを確認します。しかしながら、データの品質とユーザビリティに関する基準の多くは、ソースすなわち個々のデータセットで対処するのが最善かつ最も容易です。

このように出版者はデータセットの共有のみならず、その品質、完全性、有用性を管理し、GBIFの世界的な知識ベース内における統合性と価値を確保する上で極めて重要な役割を果たしています。下記の各項目についてデータに求められる品質と推奨事項を確認してください。

データを出版する責任者は、プロセスのできるだけ早い段階で、予期されるデータ形式とコンテンツ要件に精通することをお勧めします(オカレンス・データセットチェックリストサンプリングイベント・データセットにおける必須項目および推奨項目についてデータ例が入力された状態のGBIFのExcelテンプレートも参照ください)。そうすることで、たとえばデータ変換の追加、必須フィールドまたは強く推奨されるフィールドの情報収集、出版前データの最終品質チェックの実行と対処など、後の段階で必要になる可能性がある多くの労力を節約できます。