Guía en español sobre el uso de OpenRefine ahora disponible

Publicación final ampliada a través de la colaboración entre VertNet y SiB Colombia

Lama-guanicoe-iNat-diegocarau-hero
Una manada de guanaco (Lama guanicoe), Lago Argentino, Santa Cruz, Argentina. Foto 2016 Diego Carús via iNaturalist Research-grade Observations, licenciada bajo CC BY-NC 4.0.

El Secretariado de GBIF ha publicado una nueva guía en español destinada a ayudar a los investigadores, analistas y otras personas que manipulan datos utilizando la herramienta de código abierto OpenRefine en la limpieza y transformación de datos de biodiversidad provenientes de la red de GBIF.

Guía para la limpieza de datos sobre biodiversidad con OpenRefine ofrece explicaciones paso a paso de funciones clave y posibles abordajes para la evaluación y mejoramiento de la calidad de datos de biodiversidad utilizando OpenRefine, una herramienta de escritorio, de código abierto, para limpiar, transformar y extender registros incluidos en grandes conjuntos de datos.

"La comunidad ha reconocido por mucho tiempo la calidad de datos como un problema clave en torno a la aptitud para el uso de los datos de biodiversidad, pero tratar con ello es a menudo más fácil de decir que de hacer" dijo Paula Zermoglio de VertNet y autora principal de la guía. "Preparamos este docmento para proveer una guía fácil de seguir que ayude a los usuarios a desarrollar un conjunto inicial de habilidades que luego puedan ampliar para mejorar la calidad de los datos que comparten o utilizan."

Las conversaciones que se suscitaron durante el período inicial de revisión comunitaria incitaron a Zermoglio y al coautor John Wieczorek de VertNet a colaborar con colegas del SiB Colombia para expandir la guía. La "primera versión final" agrega nuevas secciones derivadas de materiales anteriores al mismo tiempo que acomoda y responde a los comentarios provistos por otros miembros de la comunidad.

"Al fusionar nuestro material previo en esta guía, creemos que podemos proporcionar una documentación más completa que evita confusiones y duplicación del esfuerzo necesario para mantener diferentes fuentes," dijo Camila Plata, líder del equipo de administración de contenidos en el SiB Colombia. "Este enfoque se articula muy bien con nuestro esfuerzo continuo para apoyar a la comunidad de usuarios de datos sobre biodiversidad en Colombia."

SiB Colombia—un acrónimo para "Sistema de Información sobre Biodiversidad de Colombia"—funciona como nodo de GBIF en Colombia, coordinando actividades de su propia red nacional y colaborando con otros miembros en la Región de América Latina y el Caribe de GBIF.

"La fusión exitosa de materiales de origen de VertNet y SiB Colombia marca un hito importante para toda la comunidad de GBIF," dijo Joe Miller, secretario ejecutivo de GBIF. "La guía ampliada de OpenRefine demuestra la efectividad de tener documentación mantenida por la comunidad y destaca las fortalezas de nuestra red multilingüe."

La guía de OpenRefine es la última entrega de una serie de cinco documentos digitales encargados a VertNet por GBIF, siguiendo a la guía de especies sensibles y el set de tres documentos sobre georreferenciación. Desarrollado con el objetivo de proveer orientación técnica actualizada para el desarrollo de habilidades y la capacitación en las comunidades de práctica de GBIF, el sistema de documentación digital continúa creciendo con los materiales de formación que surgen de otras actividades.

Muchos, si no la mayoría de los materiales están o estarán pronto disponibles en otros idiomas distintos del inglés, apoyado en parte por una licencia gratuita no comercial provista por CrowdIn que empodera a docenas de traductores/as voluntarios/as de toda la comunidad de GBIF. La guía de OpenRefine revierte ese flujo, y los proyectos de traducción ya han sido establecidos para las versiones en Francés e Inglés.

Aquellas personas interesadas en futuras publicaciones dentro de este programa, incluyendo oportunidades de revisión por pares y traducciones, deberían considerar suscribirse a la lista de correos de documentación digital.