Datové sady kontrolních seznamů poskytují katalog, rychlý přehled nebo základní inventář souboru pojmenovaných organismů nebo taxonů. I když mohou obsahovat další podrobnosti, jako jsou místní názvy druhů nebo citace exemplářů, tak kontrolní seznamy obvykle kategorizují informace podle taxonomických, geografických a tematických hledisek nebo podle kombinace těchto tří hledisek.
Dodržováním těchto požadavků a doporučení týkajících se kvality dat mohou vydavatelé dat zlepšit kvalitu, úplnost a hodnotu svých souborů kontrolních seznamů.
Záznamy Darwin Core
| Termín | Stav |
|---|---|
| taxonID | Vyžadováno |
| scientificName | Vyžadováno |
| taxonRank | Vyžadováno |
| kingdom | Důrazně doporučujeme |
| parentNameUsageID | Důrazně doporučujeme |
| acceptedNameUsageID | Důrazně doporučujeme |
| vernacularName | Sdílejte, pokud je k dispozici |
Metadata datové sady (EML)
| Termín | Stav |
|---|---|
| title | Vyžadováno |
| description | Vyžadováno |
| publisher | Vyžadováno |
| type | Vyžadováno |
| license | Vyžadováno |
| contact | Vyžadováno |
| creator | Vyžadováno |
| metadataProvider | Vyžadováno |
| citation | Důrazně doporučujeme |
Poznámka: Pokud je soubor údajů financován z programu provozovaného GBIF (např. BID, BIFA, CESP), jsou vyžadována další dvě pole:
| projectID | Vyžadováno |
| projectTitle | Vyžadováno |
Stav
Požadované informace
Níže uvedené položky představují minimální formální požadavky na zveřejnění datové sady kontrolního seznamu. GBIF.org nepřijme datovou sadu bez těchto podmínek a záznamy nebude indexovat. Tyto položky jsou sice povinné pro zveřejnění datové sady vůbec, ale jsou pouze výchozím bodem. Užitečnost zveřejněných dat bude stále značně omezená, pokud nebudou poskytnuty další informace.
Důrazně doporučujeme
Kromě povinných datových prvků důrazně doporučujeme vyplnit několik dalších polí, která pomáhají zlepšit užitečnost datové sady, protože:
- některé informace podporují integraci do globálního datového zdroje a zabraňují nejednoznačnosti, např. při přiřazování vědeckých názvů, které by se mohly vztahovat na více organismů (homonyma), na správné místo v rámci páteřní taxonomie
- přesnější geolokační údaje (souřadnice) výrazně zvyšují užitečnost dat pro širokou škálu případů použití
- dodatečné kvalifikátory pro některé datové prvky, např. souřadnice, podporují interpretaci těchto prvků a pomáhají uživatelům lépe odhadnout jejich užitečnost pro daný případ použití dat
- určitá redundance dat podporuje kontrolu kvality a odhalování chyb (např. testování kódů zemí oproti souřadnicím, pokud jsou poskytnuty oba kódy)
- v neposlední řadě platí, že čím bohatší je spektrum dostupných informací datové sady, tím více potenciálních oblastí využití je k dispozici, což znamená, že datová sada bude dostupnější, častěji používaná a citovaná
Sdílejte, pokud je k dispozici
Pokud máte k dispozici další data, zvažte jejich sdílení, abyste zvýšili užitečnost zveřejněných dat.
Termíny
taxonID
Darwin Core dataset element, VYŽADUJEME pro datové sady kontrolních seznamů
Jedinečný identifikátor taxonu, který umožňuje rozpoznat stejný taxon ve všech verzích datové sady i při stahování a používání dat (viz. Darwin Core Terms: Stručná referenční příručka).
V ideálním případě je taxonID trvalý globální jedinečný identifikátor. Minimálním požadavkem je, aby byl v rámci zveřejněného souboru dat jedinečný. Umožňuje rozpoznat stejný soubor informací o taxonu v průběhu času, když je indexace datové sady obnovována; propojuje další údaje, jako jsou obrázky nebo záznamy o výskytu; a umožňuje citovat záznamy např. ve zprávách o použití nebo v publikacích. To znamená, že taxonID musí spolehlivě zůstat u informací o taxonu u zdroje a důsledně odkazovat na stejný soubor informací o taxonu v publikovaných souborech dat a ve všech podkladových zdrojových datech.
scientificName
Prvek datové sady Darwin Core, pro datové sady kontrolních seznamů NEPOVINNÉ
Úplný vědecký název, případně včetně autorství a roku vzniku. V kontextu kontrolního seznamu je vědecký název základním datovým prvkem seznamu nebo hierarchie taxonů, který má soubor dat shromažďovat a zveřejňovat (viz. Darwin Core Terms: Stručná referenční příručka).
V závislosti na účelu kontrolního seznamu mohou být vědecké názvy na jakékoli hierarchické úrovni, obvykle však na úrovni druhu nebo nižší, např. u regionálních floristických nebo faunistických kontrolních seznamů, soupisů Červeného seznamu nebo tematických soupisů, jako jsou mořské organismy nebo taxonomické revize skupin druhů. Pokud má kontrolní seznam zveřejňovat hierarchii (stromovou strukturu), přidejte samostatné položky pro příslušné vyšší taxonomické stupně, např. říši, třídu a čeleď, a propojte je do hierarchické struktury pomocí parentNameUsageID (viz níže), abyste podpořili jednoznačnou interpretaci položek kontrolního seznamu.
Platné vědecké názvy jsou latinské názvy podle pravidel syntaxe příslušné skupiny taxonů (např. botanické nomenklatury). Nejsou povoleny mj. pracovní názvy ("Mallomonas sp.4"), obecné názvy ("ovocná muška") nebo názvy obsahující identifikační kvalifikátory ("Anemone cf. nemorosa"). Pokud se používají obecné názvy, měly by být uvedeny vedle vědeckých názvů pomocí souboru polí VernacularName (viz níže).
taxonRank
Element datové sady Darwin Core, pro datové sady kontrolních seznamů POVINNÝ
Taxonomická hodnost zadaného vědeckého názvu (viz. Darwin Core Terms: Stručná referenční příručka).
Taxon rank podporuje interpretaci vědeckého názvu při indexaci a podporuje přiřazení záznamů z kontrolního seznamu k základní taxonomii, zejména v případě názvů na úrovni rodu nebo vyšší (monominerály). Formát názvů vyšších taxonů v některých skupinách sice obsahuje ukazatele jejich hodnosti, není však konzistentní napříč skupinami, a dokonce ani v rámci skupin, a nelze jej spolehlivě použít pro interpretaci. Důležitým kritériem pro správné zařazení názvů je explicitní uvedení hodnosti taxonu spolu s informacemi o vyšší taxonomii. Pro praktické účely je třeba používat (hlavní) Linneovy řády: říše, kmen, třída, řád, čeleď, rod, druh. Latinské i anglické termíny jsou přijatelné.
kingdom
Darwin Core dataset element, DŮRAZNĚ DOPORUČENÝ pro datové sady kontrolních seznamů
Úplný vědecký název určující říši, do které je vědecký název zařazen (viz. Darwin Core Terms: Stručný referenční průvodce) a další vyšší taxonomii, pokud je to možné.
U vědeckých názvů existuje řada případů, kdy je přiřazení daného názvu k základní taxonomii nejisté nebo nejednoznačné. Jedná se například o homonyma (stejná jména existují pro různé organismy, obvykle napříč skupinami), nově popsaná jména, která ještě nejsou součástí stávajícího taxonomického stromu, nebo pravopisné varianty (překlepy, spojovníky atd.). Pro podporu přesného porovnání vědeckého názvu se základní taxonomií pomáhají další názvy na vyšších úrovních při interpretaci a prevenci chyb. U datových sad, kde hierarchické zastoupení ve zveřejněných datech není důležité, lze názvy vyšší úrovně uvést jako součást samotného záznamu přidáním příslušných polí DarwinCore, podobně jako u datových sad výskytu.
Názvy by měly být vědecké (latinské) názvy na hlavních Linneových stupních, například "Animalia" (říše) nebo "Rosaceae" (čeleď). Nikoliv: běžné názvy ("živočichové"), zkratky ("Rosac."), mezitřídy ("Tetrapoda" (nadtřída)) nebo polyfyletické či netaxonomické skupiny ("řasy", "býložravci").
parentNameUsageID
Prvek datové sady Darwin Core, DŮRAZNĚ DOPORUČENÝ pro datové sady kontrolních seznamů
TaxonID další dostupné vyšší (nadřazené) položky v rámci datové sady kontrolního seznamu, pokud jsou názvy vyšších taxonů uvedeny jako samostatné položky v seznamu. Viz https://dwc.tdwg.org/list/#dwc_parentNameUsageID.
Podporuje reprezentaci datové sady jako hierarchie, např. pro publikaci taxonomie.
acceptedNameUsageID
Prvek datové sady Darwin Core, DŮRAZNĚ DOPORUČENÝ pro datové sady kontrolních seznamů
V záznamu synonyma taxonID položky akceptovaného názvu taxonu v rámci datové sady kontrolního seznamu, pokud jsou uvedena synonyma i akceptované názvy. Viz http://rs.tdwg.org/dwc/terms/acceptedNameUsageID
Podporuje reprezentaci synonymie pro soubor taxonomických dat.
vernacularName
Prvek datové sady Darwin Core, SDÍLEJTE, POKUD JE K DISPOZICI, pro kontrolní datové sady
Viz http://rs.gbif.org/extension/gbif/1.0/vernacularname.xml. Pokud je zadán, přidejte také alespoň jazyk názvu s použitím kódů jazyků ISO 639-1.
title
Metadata datasetu EML, VYŽADOVANÝ pro dataové sady z kontrolních seznamů
Název, pod kterým bude dataset zveřejněn na gbif.org.
Doporučení: stručný, ale popisný název, který charakterizuje dataset v mezinárodním kontextu a odlišuje jej od podobných datových sad v jiných institucích. Např. „Čtyři nová generická a 14 nových specifických synonym u čeledi Pholcidae a přesun Pholcoides Roewer do čeledi Filistatidae (Araneae)“. Nedoporučuje se: "Araneae (Part 1) part.". Název bude mj. součástí citace datové sady při použití dat.
description
Metadata datové sady EML, pro datové sady kontrolních seznamů NEPOVINNÉ
Text v anglickém jazyce popisující datovou sadu.
Může obsahovat delší verzi názvu, popis geografického, časového a taxonomického rozsahu kontrolního seznamu, metodiku a účel sestavení podkladových dat (např. červený seznam, invazní druhy, sladkovodní taxony, regionální flóra), odkazy na příslušnou literaturu a jakékoli další informace, které považujete za důležité pro charakteristiku datové sady. Pod něj lze přidat druhou verzi popisu v jiném jazyce než v angličtině.
publisher
Metadata datové sady EML, VYŽADOVANÝ pro datové sady s kontrolním seznamem
Název instituce nebo organizace, která bude uvedena jako vydavatel dat na gbif.org.
Vydávající organizace je instituce, která datovou sadu drží nebo vlastní a je odpovědná za její obsah a údržbu. Uvedený název by měl odpovídat oficiálnímu názvu organizace, který je registrován u příslušných orgánů, uveden na internetových stránkách a případně uveden v projektové smlouvě.
type
Metadata datové sady EML, pro datové sady s kontrolním seznamem je to VYŽADOVÁNO
Typ datové sady. Zde: "kontrolní seznam".
Typ záznamu popisuje hlavní zaměření všech záznamů obsažených v datové sadě (základní záznamy). U datové sady s kontrolním seznamem bude typ záznamu vždy "checklist". Mohou se vyskytovat i výskyty spojené s kontrolními záznamy (např. vouchery taxonomického zpracování, herbářové záznamy dokumentující regionální flóru). Struktura a požadavky na tyto propojené informace se řídí pokyny uvedenými pro zveřejňování dat o výskytu.
license
Metadata datasetu EML, u datových sad s kontrolními seznamy je VYŽADOVÁNO
Strojově čitelné prohlášení o právech spojených se zveřejněnou datovou sadou. Použijte buď CC0, nebo CC BY.
Poznámka: Všechny datové soubory financované v *rámci programů BID a BIFA musí být zveřejněny buď pod licencí Creative Commons
CC0</4>, nebo CC BY Attribution. Datové sady bez platného licenčního prohlášení nebudou přijaty k publikaci. Strojově čitelné licence umožňují automatické filtry dat, které uživatelům poskytují jasné pokyny pro povolené použití záznamů, čímž podporují používání a citování dat.
contact
Metadata datasetu EML, VYŽADOVÁNO pro datové sady kontrolních seznamů
Kontaktní údaje (minimálně: jméno a e-mail) pro alespoň jeden administrativní kontakt pro datovou sadu.
Kontaktní údaje budou veřejně viditelné na gbif.org. Tyto informace jsou nutné pro zajištění možnosti komunikace o datové sadě. Kontaktní osoba pro správu je osoba/úloha, na kterou se uživatelé i centrální služby (GBIFS) obracejí v otázkách obsahu, kvality a práv týkajících se datové sady. Pokud nelze poskytnout osobní kontaktní údaje, je možné poskytnout funkční kontakt prostřednictvím jména role (např. "kurátor") a e-mailu (collections@myhouse.com). Je však nutné, aby byly jasně definovány a interně dodržovány odpovědnosti za zpracování příchozí komunikace.
creator
Metadata datové sady EML, VYŽADOVÁNO pro kontrolní datové sady
Kontaktní údaje (minimálně: jméno a e-mail) pro tvůrce datové sady (viz creator).
metadataProvider
Metadata datové sady EML, pro datové sady kontrolních seznamů povinné
Kontaktní údaje (minimálně: jméno a e-mail) na autora (autory) metadat datové sady (viz metadataProvider).
citation
Metadata datové sady EML, DŮRAZNĚ DOPORUČUJEME pro datové sady s kontrolním seznamem
text, který určuje, jak by měla být vaše datová sada citována v publikacích, které využívají vaše data.
Abyste zajistili, že vaše datová sada bude citována tak, jak si přejete, můžete výslovně uvést požadovanou citaci. Tento text se zobrazí na stránce datové sady a bude poskytován uživatelům dat spolu se soubory ke stažení, které obsahují jakýkoli příspěvek z vaší datové sady. Pokud není zadán žádný text, GBIF automaticky dodá citaci ve standardním formátu, která obsahuje název datové sady a název vydávající instituce spolu s datem stažení a odkazem na gbif.org.
projectID
Metadata datové sady EML, VYŽADOVÁNO u některých datových sad z kontrolních seznamů
Jedinečný identifikátor projektu, z něhož je datová sada odvozena
Typ záznamu je GUID nebo jiný identifikátor, který je téměř celosvětově jedinečný.
Toto pole je VYŽADOVÁNO u datové sady, která je financována prostřednictvím programů provozovaných GBIF. V tomto případě je projectID ID financovaného projektu, jak je uvedeno v zadávací dokumentaci, např. „BID-AF2016-0001-REG“.
projectTitle
Metadata datové sady EML, VYŽADOVÁNO u některých datových sad s kontrolním seznamem
Název financovaného projektu, jak je uveden ve smluvním dokumentu, ale neobsahuje ID projektu a další administrativní informace, jako jsou zde uvedené názvy projektů.
Toto pole je VYŽADOVÁNO u datové sady, která je financována prostřednictvím programů provozovaných GBIF.