Хостинг даних

Швидкий посібник для прийняття правильних рішень щодо хостингу даних, які передаються GBIF

wikimedia-servers
Wikimedia Foundation servers. Photo 2012 Victor Grigas, Wikimedia Foundation, licensed under CC BY-SA 3.0.

GBIF.org — це індекс даних про біорізноманіття, опублікований через глобально розподілену мережу національних, тематичних та проектних інфраструктур. Поміж цих взаємопов’язаних систем, видавцям важливо забезпечити стійкий та стабільний доступ до власних даних. Це складна вимога для багатьох установ, особливо для тих, які є новими в GBIF та іноді не мають умов для розміщення та підтримки даних на серверах зі стабільним онлайн-доступом.

Один із способів розпочати вирішення проблеми — розділити публікацію даних та хостинг даних. Незважаючи на те, що ці заходи пов’язані між собою, немає таких формальних чи технічних вимог, щоб одна і та ж установа повинна була виконувати обидва завдання (навіть якщо найчастіше це трапляється саме так).

Публікація даних — організація та розповсюдження даних, стандартизованих для використання через мережу GBIF. Установа стає видавцем даних GBIF, заповнивши реєстраційну форму онлайн та отримавши схвалення, або інакше через одного з національних або організаційних Учасників мережі GBIF, або через Керівну групу осередків.

Хостинг даних — зберігання даних на стабільній та доступній веб-платформі. Хоча стандартних домовленостей щодо надання цієї послуги немає, хостинг даних являє собою значне зобов’язання, яке вимагає спеціалізованого, довгострокового виділення ресурсів для підтримання стійкої та надійної онлайн-платформи.

Незалежно від того, хто займається хостингом наборів даних, GBIF надає визнання як установі-видавцю даних, так і країні, де зареєстрована така установа. Далі йде короткий посібник для прийняття обґрунтованих рішень щодо хостингу даних, які передаються GBIF.


Етапи хостингу

Після того, як ваші дані організовані у підтримувані формати даних, виконайте наступне:

  1. Станьте видавцем даних GBIF, заповнивши форму реєстрації видавця
  2. Знайдіть платформу для публікації, таку як IPT чи іншу, у порядку переваги:
    а. Хостинг у вашій установі
    б. Хостинг у національному вузлі (якщо ваша країна Учасник GBIF)
    в. Хостинг іншим учасником GBIF або видавцем даних (наприклад, центром хостингу даних)
    г. Самостійний хостинг: налаштуйте власну видавничу платформу з IPT або іншою інсталяцією у вашій установі (для цього потрібен стабільний, постійний доступ до інтернету)
    ґ. Якщо нічого з перерахованого вище вам не підходить, надішліть повідомлення до служби підтримки GBIF, пояснивши свої вимоги. Ми знайдемо IPT для вас!
  3. Отримайте доступ до IPT та навчіться основам праці з ним
  4. Почніть публікувати ваші набори даних

Варіанти хостингу даних

Хостинг даних установою видавця даних

Видавці даних, здатні розміщувати власні дані, можуть встановити власний Інтегрований набір інструментів публікації (IPT) або іншу платформу публікації даних (див. нижче)

Хостинг даних за межами установи видавця даних

Видавці даних, які мають обмежений технічний потенціал або не бажають запускати власні платформи публікації, можуть вибрати зовнішнє розміщення своїх даних. Це дозволить заощадити час та гроші на налаштуванні та підтримці власного IPT, і ви зможете отримувати підтримку на своїй власній мові, якщо хостинг даних надає її. Незважаючи на те, що існує багато можливих варіантів розміщення хостингу, організації зазвичай обирають працювати з хостом, який розділяє їх інституціональну, національну, регіональну чи тематичну спрямованість.

Якщо ваша країна вже є Учасником GBIF, то у першу чергу слід дізнатися, чи пропонує національний осередок GBIF варіанти хостингу даних. Якщо ваші дані розміщені на місцевому національному осередку, то це полегшує збір даних, що представляють національний інтерес, дозволяє вам зв’язатися з локальною мережею видавців та надає доступ до служби технічної підтримки з вашого осередку.

У випадках, коли національний осередок не надає послуг хостингу даних, GBIF має список **довірених ** центрів хостингу даних. Ці хости відповідають набору суворих критеріїв, що включають:

  • Безперебійне обслуговування та адміністрування онлайн-IPT
  • Демонстрацію успішного досвіду хостингу даних
  • Швидку та доречну роботу служби підтримки.

GBIF настійно рекомендує використовувати довірений хостинг-центр, який може створити для вас обліковий запис на їх IPT. Це дозволить вам керувати власними наборами даних та публікувати їх через GBIF.org.

Заключний варіант—це сам GBIF та хостинг даних за допомогою хмарної видавничої платформи. Секретаріат GBIF підтримує хмарні IPT-установки, наприклад для програми BID, яка надає видавцям хостинг за допомогою спільного обладнання, програмного забезпечення та служб зберігання даних. Користувачі сервісу отримують надійний, безкоштовний спосіб хостингу, який дозволить легко перенести ваші дані на власну інсталяцію в майбутньому. Однак національні осередки та центри розміщення даних, швидше за все, надаватимуть більш практичне обслуговування та допомогу за питаннями публікації та контролю якості. Як результат, видавці даних зазвичай повинні використовувати хмарний GBIF IPT лише якщо вони не в змозі знайти задовільне рішення серед інших варіантів.


Вступ до IPT: Інтегрованого набора інструментів публікації (Integrated Publishing Toolkit)

IPT—це безкоштовне програмне забезпечення з відкритим кодом, розроблене та підтримуване Секретаріатом GBIF. Організації у всьому світі використовують IPT для публікації та обміну наборами даних про біорізноманіття через мережу GBIF. IPT може також функціювати як сховище даних на які посилаються в статті, як у цьому прикладі IPT-інсталяції у хостингу мережі Canadensys.

Докладніше про технічні вимоги до хостингу IPT

Тестовий режим

IPT може бути встановлений у тестовому режимі (Test mode), і це означає, що розміщені на ньому ресурси не будуть індексовані та публічно доступні через пошук у GBIF.org. Якщо ви вирішили встановити власний IPT, GBIF рекомендує спершу спробувати тестовий режим, щоб зрозуміти процес реєстрації наборів даних. Тестовий режим призначений для оцінки IPT або для проведення тренінгу. Реєстрації проведені з тестового режиму зберігаються до тестового реєстру і ці ресурси ніколи не індексуються.

Після того, як ви впевнились, що IPT працює так, як ви очікували, вам доведеться перевстановити програмне забезпечення у виробничому режимі (Production mode), щоб зробити дані дійсно відкритими через GBIF. У виробничому режимі набори даних повноцінно реєструються та публікуються, що веде до їх індексації та загальнодоступності через GBIF.org.

Як ваш IPT, так і пов’язана з ним організація повинні бути зареєстровані в GBIF. Якщо ваша організація ще не зареєстрована, вам буде запропоновано виконати цей крок та надати основну інформацію через коротку анкету в IPT. Докладніше про те, як це працює дивиться в Посібнику користувача IPT.


Умови використання

Використання видавцем даних зовнішнього хоста повинно бути узгоджено між відповідними сторонами, в ідеалі з угодою про рівень послуг, яка визначить умови та обов’язки як видавця даних, так і хоста даних. Використання хмарного IPT регулюється Угодою видавця даних GBIF.