Hub'Eau

Le projet HUB’EAU vise à faciliter l'accès aux données de l'eau, sur l'Internet, pour les ré-utilisateurs (entreprises, scientifiques, associations, administrations, développeurs, journalistes de données). 

Le jeudi 2 juillet, Clotilde VALTER, Secrétaire d’État en charge de la réforme de l’État et de la simplification, a annoncé que le projet HUB'EAU faisait partie des 42 lauréats de l'appel à projets « Transition numérique et modernisation de l’action publique » du Programme d’investissement d’avenir. Porté par la Direction de l'eau et de la biodiversité du ministère en charge de l’écologie, ce projet est lauréat dans la catégorie « Industrialisation de la mise à disposition de données ouvertes » de cet appel à projets (voir les communiqués de presse).

Ce projet répond aux besoins exprimés dans le plan d'action du CNE pour l'accès aux données, vis à vis d'un public technique averti HORS sphère SIE, et aux besoins exprimés lors du hackathon Eau de juin 2014, qui étaient portés par le même type de public. 

 

HUB’EAU vise à réaliser un démonstrateur (Proof Of Concept)  innovant développé « au-dessus » de la partie actuelle du SI distribué du SIE offrant : 
-    Accès rapide et unifié aux données réutilisables (une seule URL pour toutes) dans des formats orientés réutilisation (JSON et GeoJSON) 
-    Structures d’accès facilitant la ré-utilisation (API REST) 
-    Information accessible indépendante de leurs formes de diffusion actuelles (flux WebServices, données fichiers,…)  
-    Composition de données auto-compréhensibles (en intégrant par exemple à la donnée les éléments référentiels, pivots externes ou URI utiles à l'usage de cette donnée de manière autonome) 

Alors que les systèmes d’information du SIE sont mis en œuvre dans des systèmes très organisés (SGBD relationnel, développement vertical par « banque de données thématique», services web SOAP,..), HUB’EAU s’appuiera sur des approches technologiques en rupture avec les « SI » actuels :
-    Transformation des flux XML SIE en flux JSON « OpenData » avec des systèmes de configuration adaptable par un administrateur ;
-    Transformation des flux standardisés OGC en flux GeoJSON pour les données spatiales ;
-    Stratégie de cache fondée sur des stockages noSQL « Documents » afin d’éviter les défaillances des systèmes sources ;
-    Infrastructure capable de « digérer » l’ensemble des données sur l’eau en France (400 millions de données et 40 millions supplémentaire / an) de type Hadoop ;
-    Système de « dénormalisation » des données vis à vis des modèles, avec intégration des données pivots ;
-    Développement agile orienté vers l’ouverture rapide d’API REST.

Dernière mise à jour le 18.04.2017