Krótki przewodnik publikowania danych w GBIF.org

Dowiedz się więcej o narzędziach, procesach i najlepszych praktykach w zakresie publikowania zbiorów danych za pośrednictwem sieci GBIF

data publishing hero image

GBIF.org obsługuje publikację czterech klas zbiorów danych, korzystając z powszechnie akceptowanych standardów zbiorów danych dotyczących różnorodności biologicznej.

Obecnie, sieć GBIF publikuje jedynie zbiory danych bezpośrednio od organizacji. Osoby, które chcą opublikować odpowiednie zbiory danych, powinny działać za pośrednictwem swojej organizacji zrzeszonej (zob. "Wniosek o zatwierdzenie" poniżej) lub rozważyć przesłanie artykułu z arkuszem danych do jednego z coraz liczniejszych czasopism.

Wolontariusze w ramach nauki obywatelskiej mogą pośrednio przyczynić się do rejestrowania wydarzeń poprzez udział w rosnącej liczbie ogólnoświatowych projektów publikujących swoje zbiory danych poprzez sieć GBIF.

Bezpieczne porozumienia instytucjonalne

Kiedy zdecydują się Państwo na udostępnianie danych poprzez sieć GBIF, powinni Państwo poinformować administratorów o planach publikowania w imieniu swojej instytucji. Udostępnianie otwartych danych może zwiększyć widoczność i wpływ instytucji, bazując na tradycyjnych metodach, takich jak publikacje akademickie i wypożyczanie okazów, i prowadzić do nowych możliwości do współpracy oraz, poprzez wykorzystanie cytatów DOI, bezpośrednio do wykorzystywania ich na potrzeby badań (przykład).

Wniosek o zatwierdzenie

Aby zostać publikującym dane, Państwa organizacja musi złożyć wniosek o zatwierdzenie do społeczności GBIF. Po przejrzeniu umowy publikacji danych i wyrażeniu zgody na udostępnianie danych, zachęcamy do jak najszybszego złożenia wniosku o zatwierdzenie dla Państwa organizacji, aby uniknąć opóźnień w publikowaniu danych.

Wybór narzędzi publikowania i partnerów

Wiele danych obecnie udostępnianych GBIF znajduje się na jednej z dziesiątek instalacji IPT: Zintegrowanego Zestawu Narzędzi Publikowania oraz coraz częściej, na krajowych instalacjach platformy Żyjących Atlasów, pierwotnie opracowanych przez Atlas of Living Australia.

Istnieją również rozwiązania alternatywne, w tym rozwiązania dla hostingu danych zarówno w ramach danej instytucji publikującej dane, jak i poza nią. Wysoko wykwalifikowani wydawcy mogą również wykorzystać API do programowego zarejestrowania zbiorów danych (po szczegółowe informacje zapraszamy do kontaktu z działem wsparcia technicznego).

Utrzymujemy również bazę wiedzy o narzędziach i innej dokumentacji.

Przygotowanie danych do publikacji

Posiadacze danych, którzy zdecydują się na udostępnianie ich za pomocą Darwin Core Archives (zob. standardy danych) mogą zapoznać się z formatem za pomocą szablonów arkuszy kalkulacyjnych stworzonych dla zbiorów danych o wystąpieniach, list kontrolnych oraz zbiórów danych uzyskanych w trakcie prac terenowych.

Posiadacze danych mają możliwość dokonania wyboru w odniesieniu do swoich ustaleń dotyczących przechowywania danych. Część z nich decyduje się na hostowanie i utrzymywanie instancji Zintegrowanego Zestawu Narzędzi Publikowania (IPT), darmowe oprogramowanie open-source opracowane przez Sekretariat GBIF. Istnieją również rozwiązania alternatywne, w tym usługi IPT świadczone przez węzły krajowe i tematyczne oraz regionalne serwisy działające w chmurze utrzymywane przez Sekretariat.

W trakcie korzystania z zaktualizowanego Narzędzia do Walidacji Danych GBIF można sprawdzić zbiory danych przed publikacją i otrzymać konkretne zalecenia dotyczące ich ulepszenia i czyszczenia. Zalecenia te mogą pomóc na przykład oznaczając zduplikowane zapisy, niekompletne pola i rozpoznane niespójności w formatowaniu.

Można również przygotować zbiory danych, aby spełnić wymagania dotyczące jakości danych GBIF-u.

Wybór licencji Creative Commons

Zgodnie z decyzją rady zarządzającej GBIF z 2014 roku, publikujący dane muszą przypisać jedną z trzech licencji Creative Commons do każdego zbioru danych o wystąpieniach:

  • CC0, w odniesieniu do danych dostępnych do dowolnego użytku, bez żadnych ograniczeń
  • CC BY, w odniesieniu do danych udostępnionych do dowolnego użytku z poprawnym przypisaniem
  • CC BY-NC, w odniesieniu do danych udostępnionych do celów niekomercyjnych z odpowiednim przypisaniem



Należy zauważyć, że licencje CC-BY-NC mają znaczący wpływ na ponowne wykorzystanie danych. GBIF zachęca publikujących dane do wyboru najbardziej otwartej opcji tam, gdzie jest do możliwe.

Publikacja zbiorów danych

Jeżeli używa się IPT, należy po prostu kliknąć przycisk, aby "zarejestrować" swój zestaw danych w GBIF. Po publikacji można wyświetlić niektóre dane statyczne (przykład), ilość użytkowników, którzy pobrali dane (przykład) oraz dające się odnaleźć cytacje literaturowe (przykład).

Dlaczego warto publikować dane o różnorodności w otwartym dostępie

Ważną częścią misji GBIF jest promowanie kultury, w której obywatele dostrzegają korzyści płynące z publikowania otwartych danych dotyczących różnorodności biologicznej, zarówno dla siebie, jak i dla całego społeczeństwa.

  • Poprzez udostępnianiu danych za pośrednictwem GBIF i podobnych infrastruktur informacyjnych, przyczynią się Państwo do poszerzania globalnej wiedzy na temat różnorodności biologicznej, a tym samym do rozwiązań promujących jej ochronę i zrównoważone wykorzystanie.
  • Publikowanie danych pozwala na integrowanie zbiorów danych z całego świata, otwierając tym samym nowe możliwości współpracy między posiadaczami danych, a badaczami.
  • Publikacja danych umożliwia osobom fizycznym i instytucjom odpowiednie uznanie ich pracy na rzecz tworzenia i selekcji danych dotyczących różnorodności biologicznej, przez uwidocznienie instytucji wydawniczych poprzez tworzenie dobrych metadanych. Dodatkowo, jeżeli są Państwo autorami recenzowanego artykułu z arkuszem danych, da to uznanie środowiska naukowego za publikację zbiorów danych dotyczących różnorodności biologicznej.
  • Kierownicy ds. zbiorów danych mogą śledzić wykorzystanie i cytaty danych zdigitalizowanych publikowanych przez swoje instytucje i dostępnych za pośrednictwem GBIF i podobnych infrastruktur.
  • Niektóre agencje finansujące wymagają obecnie od naukowców otrzymujący środki publiczne udostępnienia danych w otwartym dostępnie, po zakończeniu swoich projektów.