• Réduire le texte

    Réduire le texte
  • Rétablir taille du texte

    Rétablir taille du texte
  • Augmenter le texte

    Augmenter le texte
  • Imprimer

    Imprimer

Nouvelle méthode géostatistique spatio-temporelle pour la prévision de la pollution atmosphérique

Mis à jour le 16/01/2018
Publié le 07/01/2018

les scientifiques du réseau RESSTE

Sous l’égide du département MIA, le réseau RESSTE (RESeau Statistiques pour données Spatio-TEmporelles) a réuni des scientifiques de l’INRA, AgroParisTech, MinesParisTech, INERIS, IRD et UAPV pour travailler sur les méthodes de prédiction dans l’espace et dans le temps en présence de données massives. Outre une publication collective et du matériel pédagogique, ce travail est à l’origine d’une amélioration de la méthode pour la prévision opérationnelle de la pollution atmosphérique au lendemain réalisée par l’INERIS.

Les progrès de l'instrumentation, des systèmes électroniques embarqués, de la modélisation numérique et de l'imagerie satellite génèrent de très grandes quantités de données, géolocalisées et répétées dans le temps. Un grand nombre de variables, parfois assez fortement dépendantes, sont disponibles. Les défis posés par ces données spatio-temporelles sont multiples. Ils concernent à la fois la visualisation de ces données, la définition de modèles pertinents et leurs méthodes d'estimation dans un contexte de données massives.

Prévision de la pollution atmosphérique. © Inra, Denis Allard
Prévision de la pollution atmosphérique © Inra, Denis Allard
Le réseau RESSTE (RESeau Statistiques pour données Spatio-TEmporelles), financé par le département MIA, propose une animation scientifique autour des modèles, méthodes et algorithmes pour les données spatio-temporelles, en fédérant statisticiens et scientifiques ayant à traiter ce type de données, et en confrontant les approches et les points de vue des différents domaines de la statistique. Il a pour ambition de contribuer à une plus large diffusion des méthodes statistiques spatio-temporelles auprès des statisticiens et des modélisateurs. A moyen terme, il s'agit d'initier de nouveaux fronts de recherche en statistiques spatio-temporelles répondant aux enjeux rencontrés par les scientifiques, et de favoriser les collaborations entre équipes de recherche.

En 2016, RESSTE a organisé un atelier de travail de trois jours, à Avignon, réunissant environ 25 participants appartenant à AgroParisTech, l’INERIS, l’INRA, l’IRD et MinesParisTech. Le jeu de données, fourni par l'INERIS, concernait des données de pollution à l’ozone et en particules fines, mesurées et issues d’un modèle de chimie de l’atmosphère, au pas de temps horaire et journalier. Sur un mode « hackathon », l’objectif opérationnel était d’aboutir à une méthode de prédiction du niveau de pollution atmosphérique sur la France entière s’appuyant sur la théorie géostatistique spatio-temporelle. Au préalable, une synthèse sur les méthodes statistiques et les packages du logiciel R existants pour gérer, visualiser, modéliser et prédire des données spatio-temporelles d'assez grande dimension a été réalisée par les participants. Le deuxième enjeu de cet atelier était de partager et de diffuser le travail de synthèse au plus grande nombre en favorisant une diffusion ouverte et libre de droit, dans l’objectif d’une montée en compétence de la communauté des statistiques appliquées.

Plusieurs réalisations ont été obtenues à l’issue de ce travail :

- Un article de revue, avec signature collective RESSTE a été publié dans le Journal de la Société Française de Statistique : Analyzing spatio-temporal data with R: Everything you always wanted to know – but were afraid to ask. La publication est accompagnée d’un matériel supplémentaire contenant les données et l’ensemble des scripts réalisant l’analyse à l'aide d'outils facilitant la recherche reproductible Ainsi chacun peut s’approprier le travail, l’améliorer, le partager et le diffuser à son tour.

- Un tutoriel de 6h a été parallèlement construit. Ce tutoriel a été enseigné une première fois en ouverture de la conférence Spatial Statistics qui s’est tenue à Lancaster (Juillet 2017) devant 45 chercheurs et scientifiques internationaux. Ce tutoriel sera à nouveau présenté en ouverture de la conférence METMA – 9th Workshop on Spatio-Temporal modeling. Le matériel du Workshop est en libre accès sur le site de RESSTE

- Le travail réalisé lors de l’atelier a été le point de départ et le support de développements visant à améliorer les performances de la méthode de prévision utilisée par l’INERIS. Une comparaison de la méthode ainsi obtenue avec la méthode utilisée jusqu’alors a montré les capacités et les avantages de cette nouvelle approche dans un contexte opérationnel.

Références bibliographiques :

RESSTE network, et al. (2017). Analyzing spatio-temporal data with R: Everything you always wanted to know - but were afraid to ask. Journal de la Société Française de Statistique, 158(3), 124-158. [sans DOI]

Contact : Denis Allard, Unité BioSP, Département MIA, Centre INRA PACA