Soutenance de thèse Mathis PEYRON
Mardi 8 octobre 2024Du 10h00 Ă 12h00
Thèses Cerfacs JCA Room, CERFACS, Toulouse, France
Assimilation de données en espace latent par des techniques de deep learning
Ecole Doctorale : EDMITT
Cette thèse, située à l'intersection de l'assimilation de données (AD) et de l'apprentissage profond (AP), introduit un concept nouveau : l'assimilation de données en espace latent. Elle permet une réduction considérable des coûts de calcul et des besoins mémoire, tout en offrant le potentiel d'améliorer la précision des résultats. Cette méthode est indépendante de l'algorithme d'assimilation de données utilisé et de l'architecture des réseaux de neurones considérés.
Nous étendons davantage l’intégration de l’apprentissage profond, en repensant le processus même d'assimilation. Notre approche s'inscrit dans la suite des méthodes à espace réduit qui résolvent le problème d'assimilation en effectuant des calculs dans un espace de faible dimension. Ces méthodes à espace réduit ont été principalement développées pour une utilisation opérationnelle, car la plupart des algorithmes d'assimilation de données s’avèrent être excessivement coûteux en ressources de calculs, lorsqu'ils sont implémentés dans leur forme théorique originelle.
Notre méthodologie repose sur l'entraînement conjoint d'un autoencodeur et d'un réseau de neurone surrogate. L'autoencodeur apprend de manière itérative à représenter avec précision la dynamique physique considérée dans un espace de faible dimension, appelé espace latent. Le réseau surrogate est entraîné simultanément à apprendre la propagation temporelle des variables latentes. Une stratégie basée sur une fonction de coût chaînée est également proposée pour garantir la stabilité du réseau surrogate. Cette stabilité peut également être obtenue en implémentant des réseaux surrogate Lipschitz.
L'assimilation de données à espace réduit est fondée sur la théorie de la stabilité de Lyapunov qui démontre mathématiquement que, sous certaines hypothèses, les matrices de covariance d'erreur de prévision et a posteriori se conforment asymptotiquement à l'espace instable-neutre qui est de dimension beaucoup plus petite que l'espace d'état. Cela suggère qu'une partie seulement des informations de l'espace d'état est nécessaire pour corriger précisément l'estimation a priori. De plus, l'analyse en composantes principales (ACP) et, plus récemment, les autoencodeurs ont montré que les systèmes physiques de grande taille peuvent être représentés avec précision dans un espace de dimension réduite. Alors que l'assimilation de données en espace physique consiste en des combinaisons linéaires sur un système dynamique non linéaire, de grande dimension et potentiellement multi-échelle, l'assimilation de données latente, qui opère sur les dynamiques internes sous-jacentes, potentiellement simplifiées, est davantage susceptible de produire des corrections significatives. De plus, l'assimilation de données classique fait face à une limitation mathématique inhérente à la méthode, car elle repose sur des calculs linéaires. Aussi, l'assimilation de données latente offre une solution à cette limitation en effectuant l'assimilation directement au sein des structures dynamiques sous-jacentes, obtenues par des transformations non linéaires.
La méthodologie proposée est éprouvée sur deux cas tests : une dynamique à 400 variables – construite à partir d’un système de Lorenz chaotique de dimension 40 -, ainsi que sur le modèle quasi-géostrophique de la librairie OOPS (Object-Orientied Prediction System) développée par l’ECMWF (European Centre for Medium-Range Weather Forecasts).
Jury
Arthur VIDARD | Chargé de recherche à l’INRIA Grenoble | Rapporteur |
Tijana JANJIC | Professeure à l’Université Catholique d’Eichstätt-Ingolstadt | Rapporteure |
Ronan FABLET | Professeur à l’IMT Atlantique | Examinateur |
Alban FARCHI | Chercheur à l’ECMWF | Examinateur |
Selime GÜROL | Chercheuse au CERFACS | Directrice de thèse |
Serge GRATTON | Professeur des Universités à Toulouse INP | Co-directeur de thèse |
No content defined in the sidebar.