🎓Soutenance de thèse Mathis PEYRON
Mardi 8 octobre 2024Du 10h00 Ă 12h00
Thèses Cerfacs JCA Room, CERFACS, Toulouse, France
Assimilation de données en espace latent par des techniques de deep learning
Ecole Doctorale : EDMITT
Cette thèse, située à l'intersection de l'assimilation de données (AD) et de l'apprentissage profond (AP), introduit un concept nouveau : l'assimilation de données en espace latent. Elle permet une réduction considérable des coûts de calcul et des besoins mémoire, tout en offrant le potentiel d'améliorer la précision des résultats. Cette méthode est indépendante de l'algorithme d'assimilation de données utilisé et de l'architecture des réseaux de neurones considérés.
Nous Ă©tendons davantage l’intĂ©gration de l’apprentissage profond, en repensant le processus mĂŞme d'assimilation. Notre approche s'inscrit dans la suite des mĂ©thodes Ă espace rĂ©duit qui rĂ©solvent le problème d'assimilation en effectuant des calculs dans un espace de faible dimension. Ces mĂ©thodes Ă espace rĂ©duit ont Ă©tĂ© principalement dĂ©veloppĂ©es pour une utilisation opĂ©rationnelle, car la plupart des algorithmes d'assimilation de donnĂ©es s’avèrent ĂŞtre excessivement coĂ»teux en ressources de calculs, lorsqu'ils sont implĂ©mentĂ©s dans leur forme thĂ©orique originelle.
Notre méthodologie repose sur l'entraînement conjoint d'un autoencodeur et d'un réseau de neurone surrogate. L'autoencodeur apprend de manière itérative à représenter avec précision la dynamique physique considérée dans un espace de faible dimension, appelé espace latent. Le réseau surrogate est entraîné simultanément à apprendre la propagation temporelle des variables latentes. Une stratégie basée sur une fonction de coût chaînée est également proposée pour garantir la stabilité du réseau surrogate. Cette stabilité peut également être obtenue en implémentant des réseaux surrogate Lipschitz.
L'assimilation de données à espace réduit est fondée sur la théorie de la stabilité de Lyapunov qui démontre mathématiquement que, sous certaines hypothèses, les matrices de covariance d'erreur de prévision et a posteriori se conforment asymptotiquement à l'espace instable-neutre qui est de dimension beaucoup plus petite que l'espace d'état. Cela suggère qu'une partie seulement des informations de l'espace d'état est nécessaire pour corriger précisément l'estimation a priori. De plus, l'analyse en composantes principales (ACP) et, plus récemment, les autoencodeurs ont montré que les systèmes physiques de grande taille peuvent être représentés avec précision dans un espace de dimension réduite. Alors que l'assimilation de données en espace physique consiste en des combinaisons linéaires sur un système dynamique non linéaire, de grande dimension et potentiellement multi-échelle, l'assimilation de données latente, qui opère sur les dynamiques internes sous-jacentes, potentiellement simplifiées, est davantage susceptible de produire des corrections significatives. De plus, l'assimilation de données classique fait face à une limitation mathématique inhérente à la méthode, car elle repose sur des calculs linéaires. Aussi, l'assimilation de données latente offre une solution à cette limitation en effectuant l'assimilation directement au sein des structures dynamiques sous-jacentes, obtenues par des transformations non linéaires.
La mĂ©thodologie proposĂ©e est Ă©prouvĂ©e sur deux cas tests : une dynamique Ă 400 variables – construite Ă partir d’un système de Lorenz chaotique de dimension 40 -, ainsi que sur le modèle quasi-gĂ©ostrophique de la librairie OOPS (Object-Orientied Prediction System) dĂ©veloppĂ©e par l’ECMWF (European Centre for Medium-Range Weather Forecasts).
Jury
Arthur VIDARD | ChargĂ© de recherche Ă l’INRIA Grenoble | Rapporteur |
Tijana JANJIC | Professeure Ă l’UniversitĂ© Catholique d’Eichstätt-Ingolstadt | Rapporteure |
Ronan FABLET | Professeur Ă l’IMT Atlantique | Examinateur |
Alban FARCHI | Chercheur Ă l’ECMWF | Examinateur |
Selime GÜROL | Chercheuse au CERFACS | Directrice de thèse |
Serge GRATTON | Professeur des Universités à Toulouse INP | Co-directeur de thèse |