Cerfacs Entrez dans le monde de la haute performance...

Soutenance de thèse : Camille BESOMBES : Paramétrisation avec réseaux générateurs antagonistes pour la réduction des espaces de contrôles en assimilation de données.

  Lundi 13 décembre 2021 à 10h00

  Thèses Cerfacs    

Résumé :

Ce travail porte sur l'utilisation des réseaux de neurones génératifs et plus particulièrement les GANs (generative adversarial networks) pour la paramétrisation dans le cadre des méthodes d'ensemble pour l'assimilation de données. L'assimilation de données permet d'estimer les paramètres initiaux ou l'état d'un modèle physique à l'aide d'observations en prenant en compte les incertitudes associées à ces dernières. Le filtre de Kalman donne une solution analytique lorsque le modèle physique est linéaire et les différentes sources d'erreurs suivent une distribution Gaussienne. Les méthodes d'ensemble permettent d'appliquer cette méthode à des systèmes physiques non-linéaires représentés par des modèles numériques. L'estimation de paramètres ne suivant pas une distribution Gaussienne reste un challenge dans beaucoup de domaines. Des méthodes de paramétrisation sont alors mises en place afin de transformer ces paramètres en de nouveaux, plus adaptés aux hypothèses des méthodes ensemblistes. Une autre limitation est la cohérence des paramètres estimés et l'utilisation d'information a priori comme les contraintes physiques que les paramètres doivent respecter. En effet, les paramètres estimés peuvent ne pas avoir de sens physique comme une température négative par exemple. Les méthodes de paramétrisation sont également utilisées afin de limiter ce phénomène. Enfin un dernier avantage de ces méthodes est qu'elles permettent de limiter le nombre de paramètres en réduisant leur dimension après transformation.

Dans cette étude une nouvelle méthode de paramétrisation utilisant les GANs, appliqués à la caractérisation de réservoirs souterrains est présentée. Lors de l'estimation à l'aide de méthodes d'ensemble de la disposition des différents types de roches au sein d'un réservoir, il est courant d'obtenir des formes d'hétérogénéités géologiques irréalistes. Ces hétérogénéités sont caractérisées par des formes et des motifs particuliers issus de phénomènes physiques connus. De plus, le type de roche n'est pas un paramètre continu respectant l'hypothèse de distribution Gaussienne et est de grande dimension pour des applications industrielles. L'utilisation d'une méthode de paramétrisation est alors requise, mais la conservation du réalisme géologique par ces dernières reste soit trop peu réaliste, soit trop coûteuse numériquement. Le GAN étant une technique issue des méthodes d'apprentissage automatique et ayant récemment gagné en notoriété pour sa capacité à pouvoir apprendre et générer des images complexes. Il constitue un choix prometteur pour son application dans le domaine de la caractérisation des réservoirs souterrains. Cette étude présente les résultats obtenus sur un cas de réservoir simplifié comportant des hétérogénéités en forme de chenaux, particulièrement difficile à paramétriser par les méthodes actuelles. Une seconde application est abordée lors de cette étude portant sur la prédiction des champs atmosphériques à l'aide des méthodes d'assimilation de données. Lors de l'estimation de l'état de l'atmosphère, pour la prédiction météorologique par exemple, il est important de corriger l'état atmosphérique avec de nouvelles observations de manière que les nouveaux champs respectent les équilibres physiques qui régissent la circulation atmosphérique. Quand cela n'est pas le cas, des instabilités numériques peuvent apparaitre lors de la simulation de l'état futur de l'atmosphère, détériorant l'information apportée par les observations. L'utilisation d'un GAN capable d'apprendre les contraintes physiques qui caractérise un champ atmosphérique à l'état d'équilibre peut s'avérer utile. C'est dans ce contexte que la seconde application de cette étude s'inscrit.

Ce travail vise à présenter les performances de la paramétrisation du GAN et son applicabilité multidisciplinaire aux lecteurs qui ne sont pas familiers avec le domaine de l'apprentissage profond. Les générations issues du GANs sont codés dans un espace latent de faible dimension qui peut être échantillonné à partir d'une distribution gaussienne adaptée à l'assimilation de données d'ensemble. La propriété non supervisée de ce type de paramétrisation le rend applicable à plusieurs domaines divers tels que l'apprentissage du modèle des hétérogénéités géologiques ou l'apprentissage des contraintes physiques qui rendent un état atmosphérique équilibré.

Cette étude montre comment entraîner des GANs pour deux applications différentes : les données de réservoir souterrain et les données de climat. L'utilisation de la paramétrisation dans un ensemble basé sur l'assimilation de données tel que le lisseur d'ensemble avec multiples assimilations de données (ES-MDA) est démontrée pour le réservoir souterrain. Enfin, le conditionnement a posteriori de la fonction du GAN est examiné en utilisant l'optimisation sans dérivation.

Jury :

Olivier THUAL INP Directeur
Eric BLAYO Université Grenoble Alpes Rapporteur
Ronan FLABET IMT Atlantique Rapporteur
Manuel MARCOUX

Hélène ROUX

Corentin LAPEYRE

IMFT

Toulouse INP/IMFT

CERFACS

Examinateur

Examinatrice

Co-Directeur

Laure RAYNAUD

Olivier PANNEKOUCKE

 

 

 

 

 

Météo France – CNRM

CNRM/GMGEC/PLASMA – CERFACS/GLOBC

 

 

 

 

Invitée

Invité

 

 

 

 

 

 

 

 

L'AGENDA

Mardi

02

Avril

2024

Introduction à GIT

Mardi 2 avril 2024

  Formation    

Mercredi

03

Avril

2024

Génération de maillages avec CENTAUR

Mercredi 3 avril 2024

  Formation    

Lundi

22

Avril

2024

Méthodes numériques pour la Simulation aux Grandes Echelles avec AVBP

Du lundi 22 avril 2024 au vendredi 26 avril 2024

  Formation    

CONSULTER L'AGENDA