ShinyBIOMOD remporte le challenge GBIF Ebbe Nielsen 2020

L’équipe internationale dirigée par Ian Ondo du Royal Botanic Gardens de Kew, développe une plateforme qui améliore la visualisation, tient compte des biais de données et familiarise les utilisateurs avec les bonnes pratiques en matière de modélisation de la distribution des espèces

ondo2-feature
Ian Ondo of Royal Botanic Gardens, Kew, led the team developing ShinyBIOMOD, the winning entry in the 2020 Ebbe Nielsen Challenge. Photo courtesy of Ian Ondo.

Une équipe internationale menée par Ian Ondo, assistant de recherche au Royal Botanic Gardens de Kew, a remporté le premier prix du GBIF Ebbe Nielsen Challenge 2020. Leur projet gagnant, ShinyBIOMOD, est une interface conviviale open source, qui étend les fonctionnalités de biomod2, une plateforme reconnue de modélisation de distribution d'espèces.

Ian Ondo a développé ShinyBIOMOD avec Alexandre Antonelli, directeur scientifique du RBG Kew (ainsi que du Gothenburg Global Biodiversity Centre en Suède) et Samuel Pironon, travaillant aux côtés de Wilfried Thuiller et Maya Gueguen du Laboratoire d’Ecologie Alpine, une unité mixte de recherche du CNRS, de l'Université Grenoble-Alpes.

Leur boîte à outils basée sur R vise à aider les utilisateurs de tous niveaux à construire des modèles de distribution d'espèces (SDM) et des modèles de niche écologique (ENM), en leur fournissant des options étape par étape pour explorer, sélectionner et pré-visualiser des données supplémentaires tout au long du processus de modélisation.

Les SDMs et ENMs sont des outils qui permettent aux biogéographes et aux biologistes de la conservation de prédire la distribution potentielle des espèces dans l'espace et le temps. Bien qu'ils soient devenus essentiels à la recherche, à la fois pour comprendre les facteurs qui sous-tendent les changements de répartition spatiale et pour détecter les variations dans les aires de répartition des espèces, en particulier dans le contexte des changements environnementaux globaux, l'élaboration de tels modèles est un processus complexe.

« Les processus de création et d'interprétation précise des ENMs nécessitent une série d'étapes potentiellement sujettes aux erreurs, des compétences pointues en manipulation de données et une compréhension raisonnable des statistiques, ce qui les rend très difficiles à produire pour les non experts, déclare Ian Ondo. ShinyBIOMOD permet aux chercheurs our gestionnaires d'avoir accès à une gamme complète d'outils statistiques qui examinent les relations entre les espèces et leur environnement tout en acquérant une compréhension des bonnes pratiques et de l'incertitude derrière les prédictions ».

Le jury d'experts a sélectionné cinq autres lauréats du Challenge, le prix incitatif annuel qui honore la mémoire du Dr Ebbe Schmidt Nielsen, un leader inspirant dans les domaines de la biosystématique et de l'informatique de la biodiversité et l'un des principaux fondateurs du GBIF.

« Savoir où vivent les espèces et comment elles interagissent aidera l'humanité à relever les défis majeurs auxquels nous sommes confrontés dans le contexte de la crise de la biodiversité et du changement climatique mondial, a déclaré Jurate de Prins de la Société royale belge d'Entomologie-Koninklijke Belgische Vereniging voor Entomologie (SRBE-KBVE), membre du comité scientifique du GBIF et présidente du jury du Challenge. L'équipe de ShinyBIOMOD a appliqué les meilleures pratiques de la bioinformatique, reliant leur plate-forme aux ressources clés de biodiversité et de données environnementales pour permettre à d'autres d'explorer, de comprendre et de révéler les facteurs qui façonnent les aires de distribution des espèces à travers l'espace et le temps ».

Les deux lauréats en deuxième place sont issus du Jardin Botanique de Meise en Belgique. Avec son étude « Lier la nomenclature aux spécimens types », Maarten Trekels automatise le processus de rassemblement des besoins matériels essentiels aux révisions taxonomiques de botanique. Son collègue du JB de Meise, Quentin Groom, a présenté « InteractIAS », qui combine et visualise les interactions entre espèces et les données d'occurrence pour étayer les évaluations des risques par les experts nationaux sur les espèces envahissantes - tâches reflétant sa collaboration avec le Center for Invasion Biology de l'Université de Stellenbosch en Afrique du Sud.

Trois lauréats du troisième prix remportent les dernières places du challenge Ebbe Nielsen de cette année:

  • Navigateur de codes-barres ADN du co-vainqueur du Challenge 2018 Rod Page de l’Université de Glasgow, qui ajoute la recherche de séquence et des informations phylogénétiques et qui enrichit l'affichage des informations pour la quantité croissante d'enregistrements d'occurrences dérivées de séquences disponibles via le GBIF
  • Voyager, une boîte à outils développée par Ivvet Abdullah-Modinou de la British Science Association et Ben Scott du Natural History Museum de Londres qui adapte les données d'occurrence aux voyages nautiques historiques et prend en charge les inférences qui peuvent corriger, améliorer ou même être ajouté aux enregistrements de spécimens marins associés
  • Outil de géoréférencement de masse, un outil open source créé par Luis J. Villanueva de la Smithsonian Institution (qui a partagé le deuxième prix en 2018) qui sépare le géoréférencement de la sélection de localité et le traite comme un service dans le but de réduire les erreurs et de passer à une échelle supérieure pour répondre aux exigences de numérisation d'une collection qui s'accroît de milliers de nouveaux enregistrements chaque mois

En tant que première lauréate de cette année, l’équipe ShinyBIOMOD recevra 15.000 € sur un montant total de 34.000 €. Les deux lauréats du deuxième prix recevront chacun 5.000 € tandis que les lauréats du troisième prix recevront chacun 3.000 €.


Lauréats du prix GBIF Ebbe Nielsen Challenge 2020

Gagnant du premier prix

ShinyBIOMOD : une application R de modélisation de distribution d’espèces
Cette application R fournit une interface conviviale qui facilite la création de modèles de distribution d'espèces (SDMs) et de modèles de niche écologique (ENMs) en guidant les utilisateurs étape par étape tout au long du processus de modélisation. En fournissant une interface conviviale pour le package R bien connu, ShinyBIOMOD simplifie le processus de sélection et d'ajustement des données tout en créant des modèles de distribution d'espèces, que les utilisateurs possèdent ou non des connaissances en programmation. Ils peuvent également se familiariser avec les bonnes pratiques de modélisation au cours d'un flux de travail intuitif qui permet l'exploration et la visualisation de l'effet que leurs choix vont avoir à chaque étape du processus.


Gagnants du deuxième prix

Lier la nomenclature aux spécimens types
Les spécimens types sont essentiels dans toute révision taxonomique, mais ils peuvent être extrêmement difficiles à trouver, qu'ils soient mal étiquetés, non étiquetés comme types ou dispersés dans les collections mondiales. S'appuyant sur des données taxonomiques ouvertes, cette application Jupyter Notebook rassemble un aperçu des matériels botaniques nécessaires à réviser un taxon, en commençant par une recherche des types présents sur GBIF. Des scripts supplémentaires les relient aux protologues taxonomiques originaux du TreatmentBank de Plazi, aux identifiants de collection de l’Index Herbariorum et aux synonymes de l'International Plant Names Index (IPNI) et de Plants of the World Online. Les utilisateurs peuvent également enrichir les informations taxonomiques disponibles en identifiant les erreurs possibles dans la dénomination des spécimens, en signalant les types potentiellement non étiquetés et en tirant parti des connaissances des spécimens apparentés pour découvrir les types cachés dans les collections. video | GitHub

InteractIAS : un Jupyter notebook pour soutenir l'évaluation des risques par les experts sur les espèces envahissantes
Les évaluations des risques sur les espèces envahissantes et exotiques réalisées par les experts jouent un rôle important dans l’information des politiques nationales en matière d’environnement, de commerce et d’infrastructure. Les interactions des espèces envahissantes avec d'autres espèces offrent le meilleur moyen d'évaluer ces risques, mais en l'absence de modèles sophistiqués pour les écosystèmes ou pour les réseaux d'interactions d'espèces complexes, les experts nationaux manquent souvent de preuves pour évaluer les risques potentiels de nouvelles invasions - en particulier pour les espèces envahissantes venant d’autres continents. InteractIAS combine les enregistrements d'occurrences du réseau GBIF avec les données d'interactions d'espèces issues de Global Biotic Interactions (GloBI), permettant aux utilisateurs de visualiser le réseau d'interactions résultant pondéré par les zones d'occupation des espèces. En mettant en évidence les endroits où les espèces existantes d'un pays peuvent faire face à des impacts directs ou indirects des espèces envahissantes, l'application peut aider à guider les évaluations des risques des experts et même déclencher des recherches ciblées. video | GitHub


Gagnants du troisième prix

Navigateur de codes-barres ADN
Les données génomiques issues du codage ADN et de la métagénomique deviennent de plus en plus une contribution importante au GBIF. Le nom taxonomique, la localité et la date qui composent les enregistrements d'occurrence traditionnels se prêtent facilement à l'affichage en listes ou en points sur une carte, mais ces visualisations ignorent ce qui rend les données de séquençage uniques: la séquence. Cette preuve de concept explore des méthodes pour intégrer des outils pertinents pour les occurrences basées sur l'ADN, en particulier l'ajout d'une interface de recherche de séquence et la construction dynamique «sans alignement» d'arbres phylogénétiques. Les extensions futures pourraient intégrer des mesures de la diversité phylogénétique et échantillonner des zones géographiquement comparables, en utilisant des grilles pour construire une carte globale de la diversité phylogénétique.
video | GitHub repo

Voyager
En adaptant les enregistrements d'occurrence du GBIF aux traces de voyages maritimes historiques de découverte, cette application Web visualise la progression de ces voyages comme des expéditions de collecte. Le résultat révèle le travail des nombreux naturalistes qui ont participé à ces expéditions, rassemblant des spécimens qui constituent toujours l'épine dorsale de nombreuses collections d'histoire naturelle à travers le monde. Peut-être plus important encore, la combinaison d'enregistrements d'occurrence du GBIF avec ces données ouvertes pour les journaux de bord de l'International Comprehensive Ocean-Atmosphere Data Set (ICOADS) permet à la communauté de commencer à corriger, augmenter , faire des inférences et même «redécouvrir» des données marines qui pourraient manquer ou manquer de métadonnées clés dans le GBIF. Github

Outil de géoréférencement de masse
Le géo-référencement est une étape importante mais complexe du processus de préparation et de numérisation des données sur les spécimens de musée. Ce défi augmente considérablement avec les 146 millions de spécimens des collections mondiales du Smithsonian, qui ajoutent des milliers de nouveaux enregistrements chaque mois, à la fois à partir de nouveaux spécimens et de spécimens historiques collectés au cours des 150 dernières années nouvellement numérisés. Cet outil open source est un composant essentiel des nouveaux flux de travail que le Smithsonian prépare pour prendre en charge le géo-référencement des enregistrements à grande échelle. En séparant les éléments techniques, informatiques et logiciels et en traitant le géo-référencement comme un service distinct, le personnel des collections se concentre sur la sélection de la bonne localité pour chaque enregistrement et passe moins de temps à s'inquiéter du logiciel et des données. L'approche devrait également réduire les erreurs et les champs de données vides et résoudre d'autres problèmes géo-spatiaux en automatisant les processus d'assurance qualité et de contrôle qualité.

  • Luis J. Villanueva
    Bureau du programme de numérisation, Bureau du dirigeant principal de l'information, Smithsonian Institution

Jury du Challenge Ebbe Nielsen 2020