Use Case: Génération de bulletins météo ciblés

Coordination : Centre National de Recherches Météorologiques de Météo-France et du CNRS (CNRM)

Contact : Christophe Baehr

Partenaires académiques pluridisciplinaires :

    • (Informatique) IRIT
    • (Ergonomie) CLLE et MSHS-T
    • (Météorologie) CNRM
    • (Sciences de l'Environnement) OMP-GET

    Du cas d'étude au dépôt d'un projet

    Ce cas d'étude de DataNoos s'intéresse au croisement des données en sciences de l'environnement, et plus précisément à la difficulté de trouver les bonnes données produites par différentes disciplines pour répondre à un besoin précis et à des usages particuliers. Ainsi, il contribue à définir les conditions nécessaires pour que des jeux de données soient véritablement conformes aux principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables), y compris pour des personnes d'autres disciplines que celle des données.

    L'objectif initial de cette étude était la personnalisation de bulletins météorologiques afin que les bulletins soient adaptés aux communautés d'utilisateurs à qui ils s'adressent.

    Partant des données fournies par le centre de météorologie à partir des mesures dans les stations météo, d'images etc, et présentées sous forme de cartes, le prévisionniste doit prendre en compte les besoins de chaque communauté d'utilisateurs pour produire des bulletins météo à destination de ces communautés.

    L'étude visait à faciliter et à assister ce processus. Nous prévoyions d'automatiser ou de faciliter la production, à partir de données météo, de données (verbales) susceptibles d’être spontanément comprises par une communauté destinataire en particulier, en fonction de ses attentes. La méthode choisie était de définir des modèles d'apprentissage calculant des corrélations entre des données déjà produites manuellement : les entrées du processus (données météorologiques fournies aux prévisionnistes) et les sorties (bulletins météo ciblés en fonction de communautés (marins, "protection civile", agriculteurs ...). 

    Après un premier contact avec des chercheurs en biologie étudiant les pollens, et suite à la sortie de l'Appel à Projet Flash 2019 de l'ANR soutenant la Science Ouverte, nous avons revu l'objectif pour répondre au besoin d'un chercheur non météorologue qui veut retrouver facilement des données météorologiques. Cela revient à rendre FAIR ces données. 

    Le projet déposé, Semantics4FAIR, a été retenu par l'ANR et a démarré en Janvier 2020.

    Pour répondre à ce besoin, nous avons voulu évaluer l'apport des ontologies, des représentations sémantiques et de l'alignement entre données.

    Le projet ANR Flash Semantics4FAIR

    Le projet cherche d'abord à comprendre pourquoi des chercheurs en biologie ne retrouvent pas les jeux de données ouverts de Météo France qui leur conviennent. Il prévoir ensuite de construire des ontologies accessibles aux utilisateurs pour proposer enfin une meilleure description des jeux de données par des métadonnées sémantiques.

    Découvrez le site du projet, ses partenaires et ses résultats ici.