Requisitos de calidad de datos: Listas de verificación

Al seguir estos requisitos y recomendaciones de calidad de datos, los editores de datos pueden mejorar la calidad, la integridad y el valor de sus conjuntos de datos de listas de verificación (checklist).

Phonognatha-graeffei-iNat-Lek-Khauv
Leaf-curling spider (Phonognatha graeffei), Kingston, Victoria, Australia. Photo 2017 Lev Khauv via iNaturalist research-grade observations, licensed under CC BY-NC 4.0.

Los conjuntos de datos de listas de chequeo proporcionan un catálogo, un resumen rápido o un inventario de referencia de un conjunto de organismos nombrados o taxa. Si bien pueden incluir detalles adicionales, como nombres de especies locales o citas de especímenes, las listas de chequeo generalmente clasifican la información según líneas taxonómicas, geográficas y temáticas, o alguna combinación de las tres.

Al seguir estos requisitos y recomendaciones de calidad de datos, los publicadores de datos pueden mejorar la calidad, la integridad y el valor de sus conjuntos de datos de listas de chequeo.

Términos del Darwin Core

Término Estado
taxonID Requerido
scientificName Requerido
taxonRank Requerido
kingdom Fuertemente recomendado
parentNameUsageID Fuertemente recomendado
acceptedNameUsageID Fuertemente recomendado
vernacularName Compartir si está disponible

Metadatos del conjunto de datos (EML)

Término Estado
title Requerido
description Requerido
publisher Requerido
type Requerido
license Requerido
contact Requerido
creator Requerido
metadataProvider Requerido
citation Fuertemente recomendado

Nota: si el conjunto de datos es financiado a través de un programa operado por GBIF (p. ej., BID, BIFA, CESP), se requieren dos campos adicionales:

projectID Requerido
projectTitle Requerido

Estado

Información requerida

Los elementos enumerados a continuación constituyen los requisitos formales mínimos para publicar un conjunto de datos de lista de chequeo. GBIF.org no aceptará un conjunto de datos sin estos términos y no indexará los registros. Si bien estos elementos son obligatorios para publicar el conjunto de datos, son sólo el punto de partida. La utilidad de los datos publicados seguirá siendo severamente limitada a menos que se facilite información adicional.

Muy recomendado

Además de los elementos obligatorios de datos, recomendamos fuertemente completar varios campos más que ayuden a mejorar la utilidad del conjunto de datos porque:

  • parte de la información ayuda a la integración en un recurso de datos global y evita la ambigüedad, por ejemplo, al hacer coincidir nombres científicos que podrían aplicarse a más de un organismo (homónimos) dentro del árbol taxonómico
  • datos de ubicación geográfica (coordenadas) más precisos aumentan significativamente la utilidad de los datos para una amplia gama de casos de uso
  • los calificadores adicionales para algunos elementos de datos, por ejemplo las coordenadas, apoyan la interpretación de esos elementos y ayudan a los usuarios a estimar mejor su utilidad para un determinado caso de uso de datos
  • cierta redundancia de los datos facilita el control de calidad y la detección de errores (por ejemplo, cotejar los códigos de país con las coordenadas cuando se suministran ambos)
  • por último, pero no por ello menos importante, cuanto más rico sea el espectro de información disponible de un conjunto de datos, más áreas de uso potencial tendrá, lo que significa que el conjunto de datos será más accesible y se utilizará y citará con más frecuencia

Compartir si está disponible

Si dispone de datos adicionales, considere la posibilidad de compartirlos para aumentar la utilidad de los datos publicados.

Términos

taxonID
Elemento del conjunto de datos de Darwin Core, REQUERIDO para conjuntos de datos de listas de chequeo
Un identificador único para el taxón, permitiendo que el mismo taxón sea reconocido a través de versiones de conjunto de datos, así como a través de descargas de datos y uso (ver Términos Darwin Core: Una guía de referencia rápida).
Idealmente, el taxonID es un identificador único global persistente. Como requisito mínimo, debe ser único dentro del conjunto de datos publicado. Permite reconocer el mismo conjunto de información de los taxones a lo largo del tiempo cuando se actualiza la indexación del conjunto de datos; enlaza datos adicionales como imágenes o registros de ocurrencia; y hace posible citar registros, por ejemplo, en informes de uso o en publicaciones. Esto significa que el taxonID tiene que permanecer de forma estable con la información de origen del taxón, y referirse de forma coherente al mismo conjunto de información del taxón en los conjuntos de datos publicados y en cualquier dato de origen subyacente.

scientificName
Elemento del conjunto de datos Darwin Core, REQUERIDO para los conjuntos de datos de la lista de chequeo
El nombre científico completo, incluida la autoría y el año del nombre cuando sea posible. En el contexto de una lista de chequeo, el nombre científico es el elemento central de datos de una lista de taxones o jerarquía que el conjunto de datos está configurado para recolectar y publicar (ver Darwin Core Terms: Una guía de referencia rápida
) Dependiendo del propósito de la lista de chequeo, los nombres científicos pueden ser de cualquier nivel jerárquico, aunque típicamente serían de especies de rango o inferior para, por ejemplo listas de comprobación florística o faunística regionales, cotejos de Listas Rojas o inventarios temáticos como las revisiones de organismos marinos o taxonómicas de grupos de especies. Si se pretende que la lista de chequeo publique una jerarquía (estructura de árbol), se deben añadir entradas separadas para los rangos taxonómicos superiores pertinentes (ej. reino, clase y familia) y vincular estas en una estructura jerárquica utilizando el parentNameUsageID (véase más abajo) para apoyar una interpretación inequívoca de las entradas de la lista de chequeo.
Los nombres científicos válidos son nombres en Latín que siguen las reglas sintácticas del grupo de taxones correspondiente (por ejemplo, nomenclatura botánica). No se permiten, entre otros, nombres en proceso de determinación ("Mallomonas sp.4"), nombres comunes ("mosca de la fruta") ni nombres que contengan cailificadores de identificación ("Anemone cf. nemorosa"). Si se utilizan nombres comunes, deberán indicarse además de los nombres científicos, utilizando el conjunto de campos VernacularName(véase más abajo).

taxonRank
Elemento del conjunto de datos del Darwin Core, REQUERIDO para los conjuntos de datos de listas de verificación
El rango taxonómico del nombre científico proporcionado (ver Condiciones de Darwin Base: Una guía de referencia rápida).
El rango de taxón apoya la interpretación del nombre científico durante la indexación, y apoya la coincidencia de los registros de la lista de verificación con la taxonomía básica, especialmente en el caso de nombres a nivel de género o superior (monomiales). Aunque el formato de los nombres de los taxones superiores en algunos grupos contiene indicadores de su rango, no es coherente en todos los grupos, ni siquiera dentro de ellos, y no puede utilizarse de forma fiable para la interpretación. Para colocar correctamente los nombres, un criterio importante es especificar explícitamente el rango del taxón, junto con información sobre la taxonomía superior. Para efectos prácticos, los rangos utilizados tienen que ser Linneanos (principales): reino, filo, clase, orden, familia, género, especie. Se aceptan tanto términos en Latín como en su idioma.

kingdom
elemento del conjunto de datos de Darwin Core, FUERTEMENTE RECOMENDADO para los conjuntos de datos de listas de chequeo
El nombre científico completo que especifica el reino bajo el que se clasifica el nombre científico (véase Darwin Core: Una guía de referencia rápida) y otra taxonomía superior, si es posible.
Con los nombres científicos, hay numerosos casos en los que la coincidencia de un nombre determinado con la taxonomía central es incierta o ambigua. Este es el caso, por ejemplo, de los homónimos (existen nombres idénticos para distintos organismos, normalmente entre grupos), los nombres recién descritos que aún no forman parte del árbol taxonómico existente o las variantes ortográficas (erratas, guiones, etc.). Para facilitar la correspondencia exacta de un nombre científico con la taxonomía básica, los nombres adicionales de rango superior ayudan a la interpretación y a la prevención de errores. En el caso de los conjuntos de datos en los que la representación jerárquica en los datos publicados no es importante, los nombres de nivel superior pueden suministrarse como parte del propio registro añadiendo los campos DarwinCore pertinentes, de forma similar a los conjuntos de datos de registros biológicos.

Los nombres deben ser nombres científicos (latinos) en los principales rangos lineanos, como "Animalia" (reino) o "Rosaceae" (familia). No: nombres comunes ("animales"), abreviaturas ("Rosac."), niveles de rango intermedio ("Tetrapoda" (superclase)) o agrupaciones polifiléticas o no taxonómicas ("algas", "herbívoros").

parentNameUsageID
Elemento del conjunto de datos Darwin Core, ALTAMENTE RECOMENDADO para conjuntos de datos de listados taxonómicos
El taxonID de la siguiente entrada de mayor rango (principal) disponible dentro del conjunto de datos de listado taxonómico, si los nombres de taxones superiores se suministran como entradas separadas en la lista. Véase https://dwc.tdwg.org/list/#dwc_parentNameUsageID.
Permite representar el conjunto de datos como una jerarquía, por ejemplo, para la publicación de una taxonomía.

acceptedNameUsageID
Elemento del conjunto de datos Darwin Core, ALTAMENTE RECOMENDADO para conjuntos de datos de listados taxonómicos
Dentro del registro de un sinónimo, el taxonID de la entrada de nombre de taxón aceptado en el conjunto de datos de listado taxonómico, si se proporcionan tanto sinónimos como nombres aceptados. Véase http://rs.tdwg.org/dwc/terms/acceptedNameUsageID
Permite representar la sinonimia de un conjunto de datos taxonómicos.

vernacularName
Elemento del conjunto de datos Darwin Core, COMPARTIR SI ESTÁ DISPONIBLE para conjuntos de datos de listado taxonómico
Consulte http://rs.gbif.org/extension/gbif/1.0/vernacularname.xml. Cuando se proporcione, agregue también al menos el idioma del nombre, utilizando códigos de idioma ISO 639-1.

título
Metadatos EML del conjunto de datos, REQUERIDO para los conjuntos de datos de listado taxonómico
El título con el que se publicará el conjunto de datos en gbif.org.
Recomendación: un título breve, pero descriptivo, que caracterice al conjunto de datos en un contexto internacional y lo distinga de conjuntos de datos similares en otras instituciones. Por ejemplo "Cuatro nuevas sinonimias genéricas y 14 nuevas específicas en Pholcidae, y transferencia de Pholcoides Roewer a Filistatidae (Araneae)". No recomendado: "Araneae (Parte 1) parte.". El título, entre otras cosas, será parte de la cita del conjunto de datos sobre el uso de los datos.

descripción
Metadatos EML del conjunto de datos, REQUERIDO para conjuntos de datos de listado taxonómico
Un texto en inglés que describa el conjunto de datos.
Esto puede incluir una versión más larga del título, una descripción del alcance geográfico, temporal y taxonómico del listado taxonómico, la metodología y el propósito de la compilación de datos subyacente (por ejemplo, lista roja, especies invasoras, taxones de agua dulce, flora regional), referencias bibliográficas relevantes y cualquier otra información que considere relevante para caracterizar el conjunto de datos. Se puede agregar debajo una segunda versión de la descripción en un idioma distinto del inglés.

publisher
EML de metadatos del conjunto de datos, REQUERIDO para conjuntos de datos de lista de verificación
El nombre de la institución u organización que aparecerá como editor de datos en gbif.org.
La organización publicadora es la institución que posee el conjunto de datos y es responsable de su contenido y mantenimiento. El título indicado debe ser el título oficial de la organización tal y como esté registrado ante las autoridades pertinentes, figure en los sitios web y, si procede, tal y como se indique en el contrato del proyecto.

type
Metadatos del conjunto de datos EML, REQUERIDO para conjuntos de datos de listado taxonómico
El tipo del conjunto de datos. Aquí: "listado taxonómico".
El tipo de registro describe el enfoque principal de todos los registros contenidos en el conjunto de datos (registros principales). Para un conjunto de datos de lista de verificación, el tipo de registro siempre será "lista de verificación (checklist)". También puede haber ejemplares vinculados a registros de listas de verificación (por ejemplo, etiquetas de un tratamiento taxonómico, registros de herbario que documenten una flora regional). La estructura y los requisitos para esta información vinculada siguen las pautas dadas para publicación de datos de ocurrencia.

licencia
Metadatos del conjunto de datos EML, REQUIERE para los conjuntos de datos de listas de verificación
Una declaración legible por máquina de los derechos adjuntos al conjunto de datos publicados. Utilice CC0 o CC BY.
Nota: Todos los conjuntos de datos financiados por los programas BID y BIFA deben publicarse bajo una exención de derechos de Creative Commons C0 o una licencia de CC BY Attribution. Los conjuntos de datos sin una declaración de licencia válida no serán aceptados para su publicación. Las licencias legibles por máquinas permiten filtros automatizados de dato, los cuales proporcionan a los usuarios una clara orientación sobre el uso permitido de los registros, promoviendo así el uso y la cita de los datos.

contact
Metadatos dl conjunto de datos EML, REQUERIDO para los conjuntos de datos de lista de verificación
Datos de contacto (mínimo: nombre y correo electrónico) para al menos un contacto administrativo para el conjunto de datos.
Los datos de contacto serán públicos en gbif.org. Esta información es necesaria para garantizar la posibilidad de comunicación sobre el conjunto de datos. El contacto administrativo es la persona/rol a ser consultado sobre contenido, calidad, y cuestiones relativas al conjunto de datos, tanto por parte de los usuarios como por los servicios centrales (GBIFS). Si los datos de contacto personales no se pueden proporcionar, es posible suplantarlo por un contacto funcional a través de un nombre de rol (por ejemplo, "curador") y correo electrónico (collections@myhouse.com). Sin embargo, es necesario que las responsabilidades en el manejo de la comunicación entrante estén claramente definidas y se sigan internamente.

creator
Metadatos del conjunto de datos EML, REQUERIDO para conjuntos de datos de listas de verificación
Datos de contacto (mínimo: nombre y correo electrónico) para el creador(es) del conjunto de datos (ver creator).

metadataProvider
Metadatos del conjunto de datos EML, REQUERIDO para conujuntos de datos de listas de verificación
Datos de contacto (mínimo: nombre y correo electrónico) para el creador(es) de los metadatos del conjunto de datos (vermetadataProvider).

citation
Metadatos del conjunto de datos EML, FUERTEMENTE RECOMENDADO para los conjuntos de datos de lista de verificación
un texto que especifica cómo su conjunto de datos debe ser citado en publicaciones que hagan uso de sus datos.
Para asegurar que su conjunto de datos sea citado de la manera deseada, puede especificar explícitamente la forma de cita solicitada. Este texto se mostrará en la página del conjunto de datos, y se suministrará a los usuarios de datos junto con las descargas que contengan cualquier contribución de su conjunto de datos. Si no se especifica texto alguno, GBIF proporcionará automáticamente una cita en formato estándar que incluirá el nombre del conjunto de datos y el nombre de la institución publicadora, junto con la fecha de la descarga y una referencia a gbif.org.

projectID
Metadatos del conjunto de datos EML, REQUERIDO para algunos conjuntos de datos de lista de verificación
Un identificador único para el proyecto del cual se deriva un conjunto de datos
El tipo de registro es un GUID u otro identificador que está cerca de ser único a nivel global.
Este campo es REQUIERDO para un conjunto de datos que se financia mediante los programas operados por GBIF. En este caso, el projectID es el identificador del proyecto financiado tal como aparece en el documento del contrato, por ejemplo "BID-AF2016-0001-REG".

projectTitle
Metadatos del conjunto de datos EML, REQUERIDO para algunos conjuntos de datos de lista de verificación
El título del proyecto financiado tal como aparece en el documento del contrato. pero sin contener el identificador del proyecto y otra información administrativa, como los títulos del proyecto listados aquí.
Este campo es REQUERIDO para un conjunto de datos que se financia mediante los programas operados por GBIF.