Linked Data

Fork me on GitHub

Démarré en 2016, le projet Linked Data a pour objectif d'appliquer et de faire évoluer les pratiques du Linked Data pour un vrai Web des données environnementales.

Contribuant à des projets internationaux il associe les compétences des membres du pôle INSIDE et celles de nombreuses agences internationales travaillant sur le sujet.

Le web sémantique : un fil conducteur pour l'ouverture des données

Le web sémantique s'appuie sur un ensemble cohérent de technologies, standards et bonnes pratiques (le "semantic layer cake"), conçu pour établir des liens, contextualiser et enrichir des données autrefois isolées les unes des autres.

Initié par Tim Berners-Lee et conduit par le World Wide Web Consortium (W3C) avec la contribution d'acteurs privés et publics, le grand chantier du Linked Data fait de la sémantique des données - c'est-à-dire du sens attribué aux données - le nouveau pivot du web.

Reposant sur l'adoption par les fournisseurs de données des quatre grands principes du Linked Data, le web sémantique est un fil conducteur qui guide de nombreuses initiatives d’ouverture des données publiques, notamment dans la sphère environnementale.

L'intégration au web des données ouvertes (linked open data) s'organise et s'évalue selon une échelle ("5 stars data") allant de la simple disponibilité en ligne à la conformité totale aux bonnes pratiques visant à améliorer la visibilité et l'utilisation des données sur le web.

 

En savoir plus :

Zoom sur les recommandations internationales

Les recommandations du W3C visent à ce que les données soient 'découvrables et compréhensibles par les humains ET les machines'. Elles résultent d'un effort collectif considérable à l'échelle internationale.

Deux jeux de recommandations regroupent les bonnes pratiques sur la publication et l'utilisation des données sur le Web au sens large et, bâtissant sur les premières, les bonnes pratiques sur le partage des données spatiales (groupe conjoint W3C/OGC).

Ces bonnes pratiques suggèrent un changement d'orientation important par rapport aux infrastructures de données traditionnelles en adoptant une approche basée sur les normes web générales. Elles soulignent également l'importance des données de localisation dans le web de données, en tant qu'elles constituent souvent le facteur commun à plusieurs jeux de données.

 

Vers un écosystème vivant des données environnementales

 

Les technologies du linked data (web sémantique) sont porteuses de grandes opportunités pour la découverte et la compréhension des données environnementales.

Reposant sur des exigences d’interopérabilité sémantique et technique entre systèmes d’information, elles renforcent la « découvrabilité » sur le web d’informations contextualisées et améliorent la qualification des données et des relations entre données.

Leur application aux systèmes d’information du domaine de l’environnement permet d’envisager :

  • un décloisonnement effectif des silos nationaux, institutionnels ou disciplinaires traditionnels
  • le développement de nouveaux services d’exploration des données basés sur le rebond de données en données organiquement liées entre elles en un écosystème vivant.

Dans ce contexte, les équipes du pôle INSIDE et de ses partenaires travaillent sur 3 sujets spécifiques :

  • l'utilisation du JSON-LD pour la découverte des données en ligne et leur lien entre elles
  • les mécanismes de négociation de contenu sur des ressources identifiées par des HTTP URIs
  • le fonctionnement des résolveurs d'HTTP URI

 

Valider l'adaptation des technologies du web sémantique à l'exposition des données environnementales

Le projet OGC ELFIE

En 2017-2018, les équipes du pôle INSIDE se sont investies dans le projet ELFIE (Environmental Linked Features Interoperability Experiment) porté par l'Open Geospatial Consortium dans le cadre d'un test interopérabilité (Interoperability Experiment).

L'objectif de ce projet d'expérimentation était d'explorer les modalités d'interopérabilité entre les standards sémantiques de l'OGC appliqués aux données environnementales et les standards du web de données portés par le W3C.

Il s'agissait d'élaborer des bonnes pratiques d'exposition des liens (HTTP URIs) entre les objets de l'environnement, les stations qui les monitorent et leurs observations.

Deux cas d'utilisations réels relevant du SIE ont été traités par les équipes du pôle INSIDE : le monitoring des eaux souterraines et l'interaction entre réseaux d'eaux superficielles et souterraines.
 

Les expérimentations menées dans ce cadre ont permis de démontrer la possibilité :

  • de décrire et d'utiliser des liens entre des données décrites selont des modèles de données spécifiques (WaterML2, GroundwaterML 2, GeosciML4 et SoilML) d'une façon compatible avec les mécanismes modernes de recherche dans le Web
  • de lier ces données à des données d'observations et de mesures d'échantillons.

 

En savoir plus :

 

Le projet OGC SELFIE

En 2019-2020, les équipes poursuivent leurs travaux dans le cadre du projet OGC SELFIE (Second Environmental Linked Features Interoperability Experiment). Ce projet s'inscrit également dans le cadre d'un test d'interopérabilité OGC .

L'équipe du projet ELFIE s'est élargie et accueille des experts d'autres organisations (NASA, CSIRO, CUASHI ...)

Bâtissant sur les résultats d'ELFIE, ce second projet a pour but d'intégrer au mieux les bonnes pratiques identifiées au sein des standards sémantiques et techniques de l'OGC

Les expérimentations portent particulièrement sur les différentes représentations d'une même ressource par le web, la liaison avec les nouvelles API de l'OGC et l'intégration des travaux du groupe W3C sur l'échange de données (Data eXchange Working Group).

Elles s'organisent dans ce second volet avec la collaboration de l'ESIP fed (Earth Science Information Partners) sur la publication de données en ligne (JSON-LD pour les sciences) via la dynamique science-on-schema.org

 

En savoir plus :

BLiV: un démonstrateur de la puissance du Linked Data

Initié dans le dans le cadre d'ELFIE, BLiV (BRGM Linked Data Viewer) est une preuve de concept visant à exploiter le potentiel du Web des données. Ceci en 

  • traversant des graphes de données exposés selon les bonnes pratiques du Web des données
  • et en proposant des visualisations adaptées aux types de données rencontrées.

Pour en savoir plus, consulter les vidéos de démo :

Dernière mise à jour le 05.05.2020