Cerfacs Entrez dans le monde de la haute performance...

🎓Soutenance de thèse Mathis PEYRON

  Mardi 8 octobre 2024Du 10h00 Ă  12h00

  Thèses Cerfacs       JCA Room, CERFACS, Toulouse, France    

Assimilation de données en espace latent par des techniques de deep learning

Cette thèse, située à l'intersection de l'assimilation de données (AD) et de l'apprentissage profond (AP), introduit un concept nouveau : l'assimilation de données en espace latent. Elle permet une réduction considérable des coûts de calcul et des besoins mémoire, tout en offrant le potentiel d'améliorer la précision des résultats. Cette méthode est indépendante de l'algorithme d'assimilation de données utilisé et de l'architecture des réseaux de neurones considérés.

Nous Ă©tendons davantage l’intĂ©gration de l’apprentissage profond, en repensant le processus mĂŞme d'assimilation. Notre approche s'inscrit dans la suite des mĂ©thodes Ă  espace rĂ©duit qui rĂ©solvent le problème d'assimilation en effectuant des calculs dans un espace de faible dimension. Ces mĂ©thodes Ă  espace rĂ©duit ont Ă©tĂ© principalement dĂ©veloppĂ©es pour une utilisation opĂ©rationnelle, car la plupart des algorithmes d'assimilation de donnĂ©es s’avèrent ĂŞtre excessivement coĂ»teux en ressources de calculs, lorsqu'ils sont implĂ©mentĂ©s dans leur forme thĂ©orique originelle.

Notre méthodologie repose sur l'entraînement conjoint d'un autoencodeur et d'un réseau de neurone surrogate. L'autoencodeur apprend de manière itérative à représenter avec précision la dynamique physique considérée dans un espace de faible dimension, appelé espace latent. Le réseau surrogate est entraîné simultanément à apprendre la propagation temporelle des variables latentes. Une stratégie basée sur une fonction de coût chaînée est également proposée pour garantir la stabilité du réseau surrogate. Cette stabilité peut également être obtenue en implémentant des réseaux surrogate Lipschitz.

L'assimilation de données à espace réduit est fondée sur la théorie de la stabilité de Lyapunov qui démontre mathématiquement que, sous certaines hypothèses, les matrices de covariance d'erreur de prévision et a posteriori se conforment asymptotiquement à l'espace instable-neutre qui est de dimension beaucoup plus petite que l'espace d'état. Cela suggère qu'une partie seulement des informations de l'espace d'état est nécessaire pour corriger précisément l'estimation a priori. De plus, l'analyse en composantes principales (ACP) et, plus récemment, les autoencodeurs ont montré que les systèmes physiques de grande taille peuvent être représentés avec précision dans un espace de dimension réduite. Alors que l'assimilation de données en espace physique consiste en des combinaisons linéaires sur un système dynamique non linéaire, de grande dimension et potentiellement multi-échelle, l'assimilation de données latente, qui opère sur les dynamiques internes sous-jacentes, potentiellement simplifiées, est davantage susceptible de produire des corrections significatives. De plus, l'assimilation de données classique fait face à une limitation mathématique inhérente à la méthode, car elle repose sur des calculs linéaires. Aussi, l'assimilation de données latente offre une solution à cette limitation en effectuant l'assimilation directement au sein des structures dynamiques sous-jacentes, obtenues par des transformations non linéaires.

La mĂ©thodologie proposĂ©e est Ă©prouvĂ©e sur deux cas tests : une dynamique Ă  400 variables – construite Ă  partir d’un système de Lorenz chaotique de dimension 40 -, ainsi que sur le modèle quasi-gĂ©ostrophique de la librairie OOPS (Object-Orientied Prediction System) dĂ©veloppĂ©e par l’ECMWF (European Centre for Medium-Range Weather Forecasts).

Jury

Arthur VIDARD ChargĂ© de recherche Ă  l’INRIA GrenobleRapporteur
Tijana JANJIC Professeure Ă  l’UniversitĂ© Catholique d’Eichstätt-Ingolstadt Rapporteure
Ronan FABLET Professeur Ă  l’IMT AtlantiqueExaminateur
Alban FARCHIChercheur Ă  l’ECMWFExaminateur
Selime GÜROLChercheuse au CERFACSDirectrice de thèse
Serge GRATTONProfesseur des Universités à Toulouse INPCo-directeur de thèse

L'AGENDA

Lundi

07

Octobre

2024

Apprentissage machine pour la science des données

Du lundi 7 octobre 2024 au jeudi 10 octobre 2024

  Formation    

Mardi

08

Octobre

2024

🎓Soutenance de thèse Mathis PEYRON

Mardi 8 octobre 2024Du 10h00 Ă  12h00

  Thèses Cerfacs       JCA Room, CERFACS, Toulouse, France    

Lundi

14

Octobre

2024

Bases thĂ©oriques pour la comprĂ©hension et l’analyse de Simulations aux Grandes Echelles compressibles

Du lundi 14 octobre 2024 au mercredi 16 octobre 2024

  Formation       Cerfacs, Toulouse, France    

CONSULTER L'AGENDA