データホスティング

GBIFとの共有データをホスティングする方法について適切な決定を行うためのクイックガイド

wikimedia-servers
Wikimedia Foundation servers. Photo 2012 Victor Grigas, Wikimedia Foundation, licensed under CC BY-SA 3.0.

GBIF.orgは、国家・テーマ・プロジェクト単位で構成されるインフラの国際的な分散型ネットワークを介して出版された生物多様性データのインデックス(索引)です。この相互接続されたシステム内において、データ出版者は、永続的で安定的なアクセスポイントの下で確実にデータが共有されるようにすることが不可欠です。多くの機関、特にGBIFに参加したばかりで、常にオンライン状態にあるサーバーでデータをホスティング、維持できる設備のない機関にとって、この要件は困難な課題です。

この課題に対処する1つの方法は、データ出版データホスティングを区別することです。これらの事業は関連していますが、同一機関が両方のタスクを実行しなければならないという形式的な要件や技術的な要件はありません(実態としてはそうであったとしても)。

データ出版 は、GBIFネットワークを介した使用を目的に標準化したデータを整理し共有する活動です。機関は、オンライン登録フォームに記入し、GBIFネットワークの国や組織を代表する参加団体の一つあるいはノード運営グループから承認を得ることで、GBIFデータ出版者となることができます。

データホスティング は、アクセス可能な安定したWebプラットフォームにデータを保管する活動です。このサービスの提供について標準的な取り決めはありませんが、データホスティングを行うということは、永続的で信頼性の高いWeb接続型プラットフォームを維持することに専念し、長期的に運用する能力を約束したことになります。

誰がデータセットをホスティングするかによらず、GBIFはデータ出版機関と登録国の両方をクレジット表記するよう努めています。以下は、GBIFとの共有データをホスティングする方法について情報に基づいた決定を行うためのクイックガイドです。


ホスティングの手順

サポートされているデータ形式に整理したら、次の手順を行います。

  1. 出版者登録フォームの手続きを完了し、GBIFデータ出版者になります
  2. IPTなどの出版プラットフォームを次の優先順に探します:
    a. 所属機関でホスティングされている
    b. 国のノードでホスティングされている(GBIF参加国である場合)
    c. c. 別のGBIF参加団体またはデータ出版者によってホスティングされている(例:データホスティングセンター
    d. セルフホスティング:所属機関においてIPTなどの出版プラットフォームを独自に構築します(これにはインターネットへの安定した常時接続が必要です)
    e. 上記のいずれにも該当しない場合は、GBIFヘルプデスクにメッセージを送信し、希望する要件を説明してください。ご要件に合ったIPTをお探しします。
  3. IPTと基礎トレーニングにアクセスします
  4. データセットの出版を開始します

データホスティングにおける選択肢

データ出版機関によるデータホスティング

自らデータをホスティングする能力がある場合、データ出版者は、独自のIntegrated Publishing Toolkit (IPT)、または他のデータ出版プラットフォーム(詳細は下記参照)をインストールすることができます。

データ出版機関外でのデータホスティング

技術的な能力に限界がある場合、あるいは独自のデータ出版プラットフォームの稼働を希望しない場合、データ出版者は、データを外部でホスティングすることができます。これは、独自のIPT環境の構築と維持にかかる時間と費用を節約することができ、データホストが提供していれば母国語でヘルプデスクサポートを受けることもできます。様々なホスティング方法が存在しますが、組織は通常、所属機関、所属する国、所属する地域、またはテーマが共通するデータホストとの連携を選択します。

すでにGBIF参加国, 検討すべき最初の選択肢は、国のGBIFノードがデータホスティングソリューションを提供しているかどうかです。自国のノードでデータをホスティングすると、国内で関心の高いデータが収集しやすくなり、国内の出版者ネットワークと連携したり、国のノードからヘルプデスクサポートにアクセスしたりできるようになります。

国のノードでデータホスティングが利用できない場合には、GBIFに信頼できる データホスティングセンターのリストがあります。これらのデータホストは、以下に示した一連の厳しい基準を満たしています。

  • オンラインIPTを一貫して維持、管理している
  • データホスティングに成功した実績がある
  • 迅速で知識豊富なヘルプデスクサポートによる対応が受けられる

GBIFは、IPT上でアカウントを発行してもらうことができる信頼できるホスティングセンターを使用することを強く推奨します。これによってGBIF.orgを通じてご自身のデータセットを管理し、出版することが可能となります。

最後の選択肢はクラウドホスト型出版プラットフォームを用いてデータをホスティングすることです。GBIF事務局は、共有ハードウェア、ソフトウェアおよびストレージサービスを用いて出版者にデータホスティングを提供するクラウドホスト型IPT環境(例えば、BIDプログラムなど)を維持しています。そのサービスのユーザーは、堅牢性のある無料のデータホスティングソリューションを受けられ、将来的に独自のホスト環境へ移行することも簡単にできます。しかし、国のノードやデータホスティングセンターのほうがデータ出版や品質管理の面で充実した実践的サービス、サポートを提供している可能性が高いです。したがって、データ出版者は通常、他のホスティングの選択肢で満足の行くソリューションが得られない場合にのみに限りGBIFクラウドホスト型IPTを使用すべきです。


IPTについての紹介:Integrated Publishing Toolkit

IPTは、GBIF事務局が開発、サポートしているフリーのオープンソースソフトウェアです。世界中の組織が、GBIFネットワークを通じて生物多様性のデータセットを出版、共有するために、IPTを使用しています。また、IPTは学術論文中での参照されるデータのレポジトリとしても機能します(例えば、CanadensysネットワークのホスティングによるIPT環境)。

IPTをホスティングする技術的要件の詳細について学ぶ

テストモード

IPTはテストモードでインストールすることができます。テストモードではホスティングされるリソースについて、インデックスは作成されず、GBIF.orgからの検索によって公にアクセスされることはありません。もし、ご自身でIPTをインストールする場合は、登録プロセスを理解するために、まずテストモードを試すことをGBIFは推奨します。テストモードは、IPTを評価したりトレーニングを実施したりするときにIPTを稼働するためのものです。テストモードで登録するとテストレジストリに格納され、リソースにインデックスが作成されることはありません。

IPTが期待どおりに機能していることを確認したら、GBIFを通じて実際にデータが検出できるよう、プロダクションモードでソフトウェアを再インストールする必要があります。プロダクションモードでは、データセットが登録、出版され、インデックスが作成され、GBIF.orgを通じて公にアクセスできるようになります。

IPT環境および関連機関の両方をGBIFに登録しなければなりません。機関の登録がお済みでない場合は、この手順を完了し、IPTのショートフォームから基本情報をご提供ください。詳細な手順についてはIPTユーザーマニュアルをご確認ください。


利用規約

データ出版者による外部データホスティングの使用については、理想的にはデータ出版者とデータホストの双方に対する諸条件及び義務の概要が記載されたサービスレベルの合意書をもって、当事者同士で交渉する必要があります。GBIFのクラウドホスト型IPTの使用にはGBIF Data Publisher Agreement(GBIFデータ出版者同意書)が適用されます。