MultHy : Machine learning pour l’estimation de probabilité de défaillance pour le risque environnemental en hydraulique fluviale
Stage | Modélisation du climat et de son changement global | Applied mathematics, artificial intelligence, Environnement, Incertitude, Mathématiques appliquées, Mécanique des fluides, Multigrid methods, Numerical methods, Programmation, Python
Niveau requis : M2
Date de début : 1 mars 2024
Durée de la mission : 6 mois
Date limite des candidatures : 15 janvier 2024
Gratification : 650 euros
Sujet du stage :
L’analyse de fiabilité consiste à estimer la probabilité de défaillance d’un système en tenant compte de différentes sources d’incertitude, c’est à dire, estimer une probabilité pour des événements rares. Dans le cadre du stage, on s’intéresse à la probabilité de dépassement d’une digue de protection d’une plaine d’inondation.
On propose ici d’estimer la probabilité de défaillance à l’aide de méta-modèles par processus gaussiens enrichis par active learning, avec une approche multi-fidélité, c’est à dire en s’appuyant sur une hiérarchie de modèles de fidélités différentes.
Problème scientifique :
Un solveur haute-fidélité permet de simuler un phénomène physique de manière précise mais pour un coût de calcul élevé. La défaillance du système est définie lorsque les valeurs de sortie de $F$ dépassent une valeur seuil et une probabilité de défaillance. Etant donné des paramètres incertains du modèle, on cherche à estimer de manière aussi précise que possible, la probabilité de défaillance. Cela repose sur l’estimation d’une intégrale qui peut être estimée par échantillonnage Monte-Carlo. Cette approche est généralement incompatible avec l’usage de modèle haute fidélité compte tenu de leur coût de calcul et des techniques alternatives d’échantillonnage sont proposées dans la littérature. Néanmoins, le coût de calcul associé à l’analyse de la fiabilité doit être réduit tout en conservant une bonne précision sur l’estimation de la défaillance. Dans le but d’effectuer des analyses de fiabilité avec un budget de calcul limité, on souhaite remplacer le code haute fidélité par un méta-modèle, pour ensuite pouvoir utiliser notre estimateur. Une approche classique dans la littérature consiste à construire un méta-modèle par processus Gaussien, puis à enrichir ce méta-modèle au cours de l’analyse de fiabilité, autour du point de l’espace des entrées susceptible de mener à la défaillance. Cette construction permet d’affiner le surrogate uniquement dans les zones d’intérêt vis à vis de l’estimation de la probabilité de défaillance. Un tel processus est appelé « active learning ».
Suivant ce principe, plusieurs méthodes d’active learning pour l’analyse de fiabilité à l’aide de GP ont été développées dans la littérature. Dans le contexte de systèmes complexes, obtenir un méta-modèle précis nécessite un grand nombre d’appels au code haute fidélité, entraînant un coût de calcul conséquent. Il s’avère pertinent de faire appel à des solveurs de fidélités intermédiaires et inférieures, par conséquent moins précis, mais aussi moins coûteux. Un moyen de réduire les coûts de l’analyse de fiabilité et de garantir une estimation précise des probabilités consiste ainsi à utiliser des modèles de substitution multi-fidélité exploitant les informations de différents niveaux de fidélité. On investigue ici la construction du méta-modèle multi-fidélité, et son enrichissement par ajout de donnée, en un point qu’il convient d’identifier, issue d’une simulation réalisée avec un niveau de fidélité qu’il convient aussi de déterminer.
Application :
Le stage propose d’appliquer ces techniques d’active learning en multi-fidélité à un cas test d’hydrodynamique fluviale, en considérant l’état de défaillance comme le dépassement d’une digue en plaine sur un cas réaliste pour la Garonne Marmandaise.
Dans le cadre de ce travail, on utilisera le code de calcul Saint-Venant Telemac qui résout les équations hydrodynamiques en 2D pour des écoulements stationnaires ou instationnaires, en prenant en compte une description fine de la géométrie de la rivière, sur un maillage triangulaire non structuré.
On supposera que les incertitudes proviennent de la description des frottements dans le lit de la rivière et dans la plaine d’inondation ainsi que du débit d’apport. On supposera que la quantité d’interêt est le champ 2D de hauteur d’eau décrit sur le maillage. La définition du critère de défaillance reste à établir. La construction du méta modèle pour le champ de hauteur d’eau pourra s’inspirer des travaux de recherche réalisés au CERFACS. On supposera enfin que les niveaux de fidélité se distinguent par la résolution spatiale du maillage.
Le programme de travail pour le stage s’articule en 4 étapes principales.
1- Etude bibliographique sur les méthodes de méta modélisation, avec enrichissement et multifidélité (bibliographie déjà élaborée dans le cadre de la thèse de R. Espoeys). Extension de la bibliographie au domaine de l’hydrodynamique fluviale et dimensionnement des ouvrages.
2- Prise en main des codes et méthodes sur les méthodes de méta modélisation (par GP), d’active learning ainsi que le code existant pour les GP multifidélité et active learning
3- Prise en main du code d’hydrodynamique fluviale et du cas test idéalisé (mise en place en amont du stage). Constitution d’une base de données établie pour éprouver les méthodes classique de méta modélisation
4- Choix des critères de défaillance et implémentation des GP multifidélité avec active learning pour le cas T2D.
Stade de Maturité : analyse bibliographique déjà faite (méta-modèles multi-fidélité, enrichissement de surrogate), analyse de méthodes existantes, disponibilité de cas d’étude jouets et industriels.
Profil recherché : Recherche d’un profil de candidat math appli, programation python. Une sensibilité à la thématique mécanique des fluides et hydrodynamique est souhaitée.
Contacts :
Sophie Ricci : ricci@cerfacs.fr
Romain Espoeys : espoeys@cerfacs.fr
Didier Lucor : didier.lucor@lisn.upsaclay.fr