PhD : Système hybride d’assimilation de données et d’apprentissage profond pour la surveillance de la Terre
Thèse de doctorat | Algorithmes parallèles
Niveau requis : Master 2
Date de début : 2 septembre 2024
Durée de la mission : 36 mois
Date limite des candidatures : 15 mars 2024
Mission :
Les variables essentielles (EVs) sont des indicateurs clés pour décrire et suivre de manière adéquate l’évolution du climat changeant de la Terre. Par conséquent, la cartographie régulière et précise de variables telles que l’indice de surface foliaire, la température à la surface du sol, l’évapotranspiration ou l’humidité du sol devient de plus en plus importante pour les applications environnementales. L’imagerie satellitaire est un outil efficace pour prédire les tendances des VE, définir les conditions actuelles et informer sur leur évolution future. En particulier, les missions Sentinel offrent d’incroyables possibilités de fournir des informations précises, opportunes et facilement accessibles sur la surface de la Terre. Cependant, l’extraction d’informations utiles à partir d’images satellites brutes acquises par des capteurs multimodaux, qui sont non stationnaires, peu denses, multi-variées et présentent des lacunes temporelles, constitue un véritable défi. L’extraction de l’EV à partir d’observations satellitaires bruitées est traditionnellement considérée comme un problème de modélisation inverse.
Ces dernières années, des méthodologies basées sur des données à contraintes physiques ont été proposées pour déduire les valeurs des paramètres du modèle physique à partir des observations. Sans s’appuyer sur des données de simulation, ces méthodes ont été proposées pour entraîner un réseau neuronal profond à cartographier les observations satellitaires dans les paramètres du modèle physique de manière non supervisée. Pour ce faire, ces méthodes considèrent que les paramètres du problème inverse sont les variables latentes d’un autoencodeur variationnel sémantique dans lequel la partie décodeur est un modèle physique incorporant des connaissances sur la génération de données. Avec la disponibilité croissante d’ensembles de données à grande échelle, ce cadre non supervisé est un choix intéressant pour la modélisation et la prévision de la dynamique spatio-temporelle de l’EV à partir d’observations par satellite.
Objectifs :
Cette thèse vise à prédire les états futurs des EV en combinant les stratégies d’apprentissage automatique (ML) et d’assimilation de données (DA) à partir d’observations satellitaires bruyantes et éparses. D’une part, l’apprentissage automatique peut bénéficier de l’assimilation de données, qui s’adapte aux observations réelles qui sont bruyantes, éparses et seulement indirectement liées à l’état physique d’intérêt comme l’EV. La DA suit l’approche bayésienne pour représenter les incertitudes des observations et conserve les connaissances physiques existantes. D’un autre côté, l’AD pourrait bénéficier de la ML pour traiter des modèles et des distributions d’erreurs plus complexes.
Étant donné que le modèle dynamique de propagation temporelle des VE est inconnu, nous nous concentrerons d’abord sur un modèle physique entièrement basé sur des données pour prévoir les VE dans des situations hypothétiques qui sont obtenues en forçant des hypothèses spécifiques sur les scénarios météorologiques futurs. Une fois le modèle dynamique développé, des stratégies d’assimilation de données seront intégrées pour utiliser les observations en temps réel afin d’ajuster progressivement les trajectoires des VE dans le temps. Dans le cadre de ce projet, nous étudierons différentes stratégies pour obtenir une meilleure estimation des VE.
D’un point de vue méthodologique, ce doctorat propose d’étudier la combinaison de l’apprentissage automatique et des stratégies d’assimilation de données, qui est l’un des sujets les plus brûlants de l’intelligence artificielle.
Consortium :
La recherche menée ici sera intégrée à l’ANITI (Institut d’Intelligence Artificielle et Naturelle de Toulouse) auquel le CESBIO et le CERFACS participent activement. Le financement de la thèse sera assuré en partie par le CNES et en partie par Thales Services Numériques.
Profil :
Nous recherchons des personnes enthousiastes pour rejoindre notre groupe de recherche interdisciplinaire. Les candidats doivent être titulaires d’un Master en informatique (science des données ou similaire). Les candidats doivent de préférence avoir de solides connaissances en mathématiques, en traitement du signal et de l’image et en apprentissage automatique. Une bonne connaissance de l’anglais et de la programmation scientifique est requise.
Postulez :
Veuillez envoyer votre CV et votre lettre de motivation à
- Silvia Valero-Valbuena : silvia.valero-valbuena@iut-tlse3.fr
- Selime Gürol : gurol@cerfacs.fr