• English
  • Français

GEOFLOW

Présentation de la chaîne de traitements GEOFLOW sous R

Le plan National Science Ouverte lancé en juillet 2018, rend obligatoire l’accès ouvert pour les publications et pour les données issues de recherches financées sur projet. Ce plan renforce la directive INSPIRE de mars 2007 visant à établir une infrastructure de données géographiques pour favoriser la protection de l’environnement, en assurant l’interopérabilité entre les bases de données et facilitant la diffusion, la disponibilité, l’utilisation et la réutilisation de l’information géographique en Europe. Notamment, l’enjeu est de fournir des données avec des métadonnées riches et rendre les données accessibles autant que possible. 

Geoflow (développé par E. Blondel avec le soutien financier de INRAE, IRD, FAO et RZA) est un orchestrateur de packages R développés en open source à des fins de gestion des données et métadonnées (cf. Figure 1). Geoflow permet une gestion FAIR des données et de leurs métadonnées associées, en recentrant les efforts de l’utilisateur sur la seule production des métadonnées. Le support tabulaire utilisé est accessible à tous, et chaque utilisateur peut choisir son logiciel d’édition (google sheet, Excel, postgresql …). Geoflow, via l’exécution d’un seul script R, permet la publication des métadonnées dans un grand nombre de dépôts standardisés. Geoflow a été développé dans le but d’assurer à minima la production de métadonnées au standard Dublin Core, ISO 19115/19139 et EML.

Geoflow produit des métadonnées aux standards souhaités dont la norme ISO 19115/19139, via le package geometa, et propose un rapport de validité (validateur INSPIRE) ; des fichiers XML valides ISO19115 pouvant être publiés dans geonetwork (via geonapi), des géocatalogues CSW (via osw4R) ou encore des catalogues EML comme Metacat; il permet la création de DOI sur Zenodo (via zen4R), Dataverse (via atom4R) ; la création de flux de données cartographiques (WMS-WFS) sur un Geoserver (via geosapi). Il est également possible d’utiliser un outil complémentaire (Open Fair Viewer) pour consulter et visualiser toutes ces informations produites (données et métadonnées).

Figure 1 : A gauche : les données d’entrées (3 fichiers attendus : métadonnées, contacts et potentiellement les données); A droite : les briques de geoflow ; les ronds représentent les packages ; les carrés les cibles (en rouge : en cours de construction ; en bleu, noir et vert : existant ; en violet : à venir)

Accessible à tous, geoflow requiert très peu de compétences en programmation R (à venir en 2022 : une interface sous Rshiny pour paramétrer simplement le workflow et s’affranchir de l’utilisation de R). Il vise notamment à favoriser la prise en main par les producteurs de données.

Formation à venir : Ecole Thématique E-ENVIR 2021 à Strasbourg – nov. 2021 + les formations du réseau SIST

Pour plus d’information, contactez : lter-fr-bed-pilotage@groupes.renater.fr

Dépôt officiel Geoflow : https://github.com/eblondel/geoflow/

WIKI : https://github.com/eblondel/geoflow/wiki