Skip to main content

    Požadavky na kvalitu dat

    Vydavatelé hrají zásadní roli nejen při sdílení datových souborů, ale také při řízení jejich kvality, úplnosti a užitečnosti a při zajišťování jejich integrace a hodnoty v rámci globální znalostní základny GBIF.

    Male baya weaver (<em>Ploceus philippinus</em>) waits outside as a female inspects the nest he built from inside. Females baya weavers select mates on the basis of the quality of nest construction. Photo by Malay Mehta via <a href="https://www.gbif.org/occurrence/891775469">iNaturalist Research-grade observations</a>, licensed under <a href="http://creativecommons.org/licenses/by-nc/4.0/">CC BY-NC 4.0</a>.

    Pro sdílení dat prostřednictvím GBIF.org musí vydavatelé obvykle srovnat nebo transformovat stávající datové sady do standardizovaného formátu. Tato práce může zahrnovat další zpracování, úpravy obsahu a mapování obsahu datové sady do některého z dostupných formátů pro přenos dat, jakož i zveřejnění prostřednictvím některého z dostupných nástrojů pro publikování dat, jako je například bezplatný open-source Integrated Publishing Toolkit nebo IPT od GBIF.

    Po zveřejnění infrastruktura GBIF v reálném čase "indexuje" nebo "sklízí" nové datové soubory a integruje je do společného přístupového systému, kde mohou uživatelé získat všechna data prostřednictvím společných služeb vyhledávání a stahování. Při indexování datových sad provádí GBIF.org další kontroly, interpretace a konverze, aby zajistil interoperabilitu dat a jejich soulad s minimálními standardy datových formátů, kvality dat a vhodnosti pro použití. Mnohá kritéria kvality a použitelnosti dat se však nejlépe a nejsnadněji řeší přímo u jejich zdroje: u jednotlivých datových souborů.

    Vydavatelé tak hrají zásadní roli nejen při sdílení datových sad, ale také při řízení jejich kvality, úplnosti a užitečnosti a při zajišťování jejich integrace a hodnoty v rámci globální znalostní základny GBIF. Další informace o požadavcích na kvalitu dat a doporučeních pro

    V praxi doporučujeme osobám odpovědným za zveřejňování dat, aby se co nejdříve v průběhu procesu seznámily s očekávanými formáty dat a požadavky na obsah (viz také předkonfigurované šablony GBIF v aplikaci Excel s požadovanými a doporučenými termíny pro datové sady výskytu, kontrolní seznamy a datové sady pro odběr vzorků, které jsou k dispozici s příkladovými daty). Ušetříte si tak mnoho úsilí, které může být zapotřebí v pozdějších fázích, například při přidávání převodů dat, zachycování informací pro povinná nebo důrazně doporučená pole nebo při provádění a řešení závěrečných kontrol kvality dat před zveřejněním.