Sourcier

Sourcier

Sourcier : comment faciliter l'accès à des données grace à un moteur de recherche 

Les applications orientées recherche (ou SBA pour Search-Based Applications) constituent une approche logicielle et ergonomique à part entière. Plaçant le moteur de recherche au centre des échanges et des fonctionnalités, elles apportent des réponses parfois plus adaptées et plus efficaces que les approches de diffusion classique. En leur qualité de hub d'information agrégeant des données très souvent issues de plusieurs sources, elles constituent par ailleurs une option pertinente dans le cas des systèmes répartis, et en particulier dans celui du Système d'Information sur l'Eau.

Mal maîtrisées, elles peuvent en revanche conduire à de nombreux travers. Offrir un accès à une interface trop complexe et décorrélée des données indexées conduit les utilisateurs à formuler des requêtes contradictoires aboutissant à des réponses vides et frustrantes. De la même façon, l'absence de guide (comme les mécanismes de suggestions) risque de rebuter l'utilisateur venu explorer le site par curiosité. Enfin, il est inutile de citer les problématiques de performances qui, si elles ne sont pas maîtrisées, réduiront à néant les efforts faits sur les autres aspects.

Un projet de R&D sur cet axe a donc vu le jour en collaboration avec la société Exalead, société experte en indexation et fouille de données, et qui commercialise une solution d'entreprise, CloudView, déjà utilisée dans certaines applications du SIE. Basé sur un cas d'étude relatif aux eaux souterraines, il a été baptisé Sourcier. Il s'était fixé comme objectif de réaliser un prototype offrant un accès simple (3 clics maximum) et rapide (3 secondes maximum) aux quelques dizaines de millions d'analyses de qualité chimique des eaux souterraines de la banque ADES.

 capture d'écran

Le premier enjeu consistait donc à metre en place une recherche multi-dimensionnelle (paramètre mesuré, plage de concentration, période de mesure, emprise spatiale) sur un volume important de données sans que cela n'impacte les performances du service rendu. La partie géographique constituait en elle-même un challenge technologique puisque le produit CloudView et plus particulièrement son moteur d'indexation n'incluait pas de cartouche géographique.

En parallèle, le livrable final devait fournir un premier niveau de réponse aux questions d'ergonomie et de simplicité d'usage suivantes : comment ne pas perdre un utilisateur ne possédant pas d'emblée de connaissances sur les éléments de qualité des eaux souterraines ? Comment éviter les effets "feuille blanche" ou "requêtes infructueuses" ? Et en corollaire, comment préparer et présenter les données afin de gommer la complexité issue de la modélisation et de l'expertise scientifique ?

 

Ce projet, aujourd'hui officiellement terminé, perdure par ses nombreux résultats :

  • Tout d'abord, au travers du prototype qu'il a permis de mettre en place et qui répond aux objectifs techniques et ergonomiques fixés initialement. C'est d'ailleurs pour cette raison que les partenaires ont conjointement décidé de le maintenir depuis quelques années déjà. A noter tout de même qu'il se base sur les données 2009 de la banque ADES, et qu'à ce titre, son exploitation vis-à-vis des données diffusées ne saurait répondre à des besoins d'études scientifiques.
  • Ensuite, puisqu'il a rendu possible le développement d'un module d'indexation géographique au sein de CloudView, module totalement intégré au produit dans sa version suivante à celle utilisée par Sourcier.

Dernière mise à jour le 18.05.2020