Le Deep Learning au service de la segmentation d’images en Géosciences
17 minutes
8th of January, 2024
Crédit image : Dall.e 3.0
La segmentation d'images, une méthode d'analyse visuelle, est une opération de traitement d’images qui consiste à détecter et rassembler les pixels suivant des critères, notamment d’intensité ou spatiaux. Ses applications sont variées : imagerie médicale, analyse d'images satellitaires, reconnaissance faciale ou bien encore les systèmes de caméras des véhicules autonomes.
À l'ère de l'Intelligence Artificielle et des récents développements dans les domaines de l'apprentissage supervisé et auto-supervisé, les techniques de segmentation d'images ont connu des améliorations significatives. Ces avancées technologiques ouvrent de nouvelles perspectives pour des opérations plus rapides et précises dans des domaines cruciaux tels que la géologie, notamment dans le contexte du stockage géologique du carbone, que notre projet SCHISM vise à optimiser.
Le projet SCHISM (Semantic Classification of High-resolution Imaging for Scanned Materials), élaboré au sein du département de Recherche et Développement Appliqué d’Akkodis, représente une avancée significative dans le domaine des Géosciences. Il se manifeste sous la forme d'une plateforme en ligne dédiée à la segmentation d'images et de scanners, avec le support de l'Intelligence Artificielle et notamment du Deep Learning.
L'objectif principal de cette plateforme est d'optimiser et d'accélérer le processus de segmentation, une étape cruciale dans les études du sous-sol. Cela revêt une importance particulière dans le contexte du stockage géologique, où la réinjection du carbone dans le sous-sol, une pratique essentielle pour lutter contre le réchauffement climatique (CCS - Capture et Stockage de Carbone), exige une précision et une fiabilité maximales pour assurer la sécurité et la durabilité du stockage.
Florent Brondolo, chef de projet R&D en Géosciences et IA et Tom Salic, ingénieur de recherche et tech lead modélisation au sein du département Recherche et Développement Appliqué d’Akkodis nous en disent plus.
Tom, Florent, pouvez-vous vous présenter ?
[Tom] J’ai une formation en Ingénieur ENSTA Bretagne en génie mécanique, complétée par un doctorat portant sur la modélisation multi-physique des éoliennes flottantes, dans le but d'implanter des méthodes de contrôle-commande. Actuellement, chez Akkodis R&D, je suis impliqué dans le projet SCHISM, où nous nous concentrons sur l'étude des écoulements dans des roches poreuses.
[Florent] Mon parcours académique inclut un PhD de l’université d’Edimbourg, ainsi qu’un postdoc réalisé à Stanford. Dans ces deux formations, j’ai orienté mes recherches vers la physico-chimie des roches tout en conservant un lien étroit avec l'imagerie 3D. Actuellement chez Akkodis R&D, je me concentre sur des projets qui combinent l'imagerie 3D et l'interprétation des données grâce aux techniques de Deep Learning.
Quelle est la genèse du projet SCHISM ?
[Florent] Le projet SCHISM, issu du domaine des géosciences, se concentre sur la segmentation d’image, une technique qui subdivise une image en différentes parties et permet d’identifier chaque substance ou structure spécifique. Cette démarche permet d’étiqueter les éléments clés d'une image pour en faciliter la compréhension par les ordinateurs.
Dans le contexte des Géosciences, nous nous focalisons sur l'analyse de la composition des roches, englobant les minéraux, les grains, les vides, etc. La segmentation d'un scanner de roche devient cruciale lors de l'étude géologique (Figure 1) car les données issues de cette segmentation jouent un rôle décisif dans la création de modèles géologiques précis. Ces modèles, basés sur des données segmentées, sont essentiels pour surveiller et garantir la séquestration du dioxyde de carbone (CO2) dans le sous-sol, contribuant ainsi à la réduction des émissions de gaz à effet de serre.
https://www.digitalrocksportal.org/projects/172
Or, dans ces études, la phase de segmentation se révèle être un défi scientifique. En effet, au cours d’études de caractérisation des milieux souterrains, la subjectivité et l'imprécision associées à ce processus, la rareté des données présentes, et l’aspect chronophage du processus deviennent des freins à une modélisation précise.
Le projet SCHISM a été initié pour répondre à ce défi, et aux besoins de l'industrie et du milieu scientifique. Au sein du département Recherche et Développement Appliqué d’Akkodis, l'équipe m'a confié la responsabilité de créer un projet à double objectif : produire des segmentations de très hautes qualités générées en un temps minimal et créer un outil ad-hoc simple et performant utilisant le Deep Learning.
En résumé, notre mission consiste à apporter une expertise aux partenaires académiques et industriels dont les projets visent à caractériser les milieux souterrains lors de l'injection de CO2 dans le sol.
Qu’est-ce que la séquestration du CO2, et en quoi SCHISM s’inscrit dans ce processus ?
[Florent] Le Captage et Stockage du Carbone (CCS) est une technologie clé dans la lutte contre le changement climatique. Elle implique la capture CO2 à sa source, comme les centrales électriques thermiques ou les industries lourdes, et son stockage dans des formations géologiques souterraines pour éviter son émission dans l’atmosphère.
Dans le domaine des Géosciences, où les modèles traditionnels sont établis pour l'extraction de ressources comme le pétrole, le projet SCHISM réoriente la focale : s'inscrivant dans le cadre du catalogue "decarbonized industry" SCHISM se concentre sur la réinjection du carbone dans le sous-sol pour lutter contre le réchauffement climatique via le CCS. Cette réinjection nécessite une modélisation précise de la distribution du CO2 dans les roches hôtes pour assurer la stabilité de son stockage à grande échelle. Ce type de modélisation peut s’étendre de l’échelle régionale (plusieurs km) jusqu’au nanomètre, et est adapté aux spécificités de chaque projet (voir figure 2). L’objectif est de prédire avec précision le comportement du CO2 une fois injecté dans le sous-sol, pour s’assurer qu’il reste confiné de manière stable et permanente.
La modélisation repose donc sur une analyse détaillée du réseau poreux des roches, qui est visualisé grâce à des techniques d’imagerie avancées. Ces images sont ensuite soumises à une analyse numérique et à une modélisation physique pour comprendre et prédire les interactions entre le CO2 et la roche hôte. À l’échelle du pore, mesurant souvent quelques millimètres, la segmentation d’image joue un rôle crucial. Elle consiste à découper numériquement l’image pour en extraire des modèles tridimensionnels précis. Cette étape permet d’isoler les différents composants minéralogiques, le réseau poreux, de détecter d’éventuelles fractures, etc. Cependant, cette segmentation, lorsqu’elle est effectuée manuellement par des opérateurs, peut introduire des erreurs liées à l’interprétation personnelle. De plus, il est peu probable que deux opérateurs produisent des résultats identiques. Pour finir, le processus peut être extrêmement long.
Face à ces défis, il est essentiel de développer des méthodes automatisées de segmentation d’image. Ces solutions doivent allier la précision nécessaire pour une modélisation fiable à une efficacité temporelle, réduisant ainsi le temps de traitement tout en conservant la qualité des résultats, et leur reproductibilité. C'est ici que SCHISM intervient en proposant une plateforme de segmentation d'images en ligne, intégrant des méthodes d'IA pour répondre aux besoins opérationnels des géosciences. SCHISM permet des segmentations plus précises, augmente la reproductibilité, et reste accessible aux opérateurs non-experts en IA, tout en facilitant son utilisation grâce à une interface simplifiée, mais offrant une entière liberté de paramétrage aux utilisateurs.
Où est l’intérêt d’employer un outil tel que SCHISM ?
[Florent] L'utilité de SCHISM se manifeste particulièrement dans le tandem segmentation / simulation des comportements du CO2. À une échelle plus large, une mauvaise classification d'un pixel ne perturbe que modestement le mouvement des fluides. Cependant, à l'échelle millimétrique ou centimétrique d'un scanner de roche, une segmentation défectueuse (par exemple attribuer un pixel à la porosité au lieu de le classer dans la matrice rocheuse) peut engendrer des variations significatives dans les équations, ce qui peut potentiellement compromettre la stabilité du stockage de CO2 et générer des risques tels que des fuites incontrôlées. La nécessité d'une segmentation extrêmement précise devient donc cruciale dans ce contexte.
Le projet SCHISM prend toute son importance ici. En tant que plateforme numérique destinée aux professionnels des géosciences, nous offrons l’apprentissage profond pour simplifier la segmentation des images issues de divers scanners. Parmi les avantages significatifs, on peut citer la capacité à s’adapter à la quantité de données d’entraînement fournies par l’utilisateur, l’amélioration de la précision des résultats, l’augmentation de la reproductibilité, l’adaptabilité, un traitement largement automatisé des données, la robustesse face à la variabilité des données, la réduction de la sensibilité au bruit, la diminution des temps de traitement, et bien plus encore. En résumé, SCHISM se positionne comme un allié inestimable pour des segmentations scientifiquement qualitatives.
De plus, nous nous investissons dans le développement de la certification des résultats, supervisée par Tom.
[Tom] La validation des résultats issus de l'intelligence artificielle par des experts revêt une importance cruciale. Elle garantit la fiabilité et la précision de ces résultats.
Dans le domaine de l'ingénierie des sous-sols, où l'accès à des experts peut être limité, une étape de certification est en cours de développement. Cette certification consiste à comparer le résultat d’un modèle utilisant l'intelligence artificielle à un modèle physique classique. L'objectif est de vérifier si les résultats produits par l'IA, à travers des images segmentées prédites, correspondent aux données réelles et scientifiquement validées. Ainsi, si les sorties de ces deux modèles, IA et physique, convergent et présentent des valeurs similaires, voire identiques, cela confirme la justesse des paramètres utilisés par l'intelligence artificielle (ici, SCHISM) et leur capacité à représenter fidèlement le domaine analysé.
Cette certification se concentre sur l'analyse des mouvements de fluides à travers la structure rocheuse en utilisant la simulation numérique des fluides pour examiner de près les variations de pression. Ce paramètre permet -in fine- d'évaluer la perméabilité des roches, c'est-à-dire leur capacité à laisser passer un fluide ou un gaz à travers leurs pores. Cette relation entre le débit et le gradient de pression, établie grâce à la loi de Darcy, s'avère fondamentale dans la caractérisation de la perméabilité des roches.
L'objectif final de cette démarche de certification est d'améliorer la précision du modèle IA pour des applications concrètes. En réalisant des calculs de perméabilité sur des images segmentées et en validant ces calculs par rapport à la réalité observée sur le terrain, on vise à renforcer la fiabilité du modèle IA dans des conditions réelles, où la géométrie interne des roches peut être complexe.
Quels sont les améliorations et futurs développements en cours ?
[Florent] Le projet SCHISM comporte 3 axes majeurs :
Le premier est l’axe segmentation qui propose un outil de segmentation via l’IA. Les entraînements supervisés donnent de bons résultats. L’axe de recherche actuel prend la direction des entraînements auto-supervisés, se passant au maximum des données d’entraînements. A l’heure de cette interview, une application en ligne est disponible et fonctionnelle.
Le second axe, en phase de recherche actuellement, est lié à l’axe certification qui propose de vérifier la précision de la segmentation.
Et le troisième est l’axe scanner synthétique qui permet de générer des données d’entraînement supplémentaire dans le cas où l’utilisateur n’aurait en sa possession pas suffisamment de données source pour réaliser un entraînement.
Ces 3 axes sont développés en parallèle et sont complémentaires.
L’axe segmentation est le plus abouti. L’axe scanner synthétique est fonctionnel mais non implémenté pour le moment car il est en phase de test. Des techniciens et ingénieurs travaillent dessus de façon assidue.
Concernant l’axe certification, je vais laisser la parole à Tom.
[Tom] Dans l’axe certification, on cherche à automatiser la simulation qui servira de « certification ».
La simulation est opérationnelle, mais l'automatisation du traitement des données doit encore être mise en place. L'objectif est de rendre la simulation numérique accessible même pour des utilisateurs non-experts.
Pour la certification, deux approches sont envisagées : comparer nos simulations avec un solveur spécialisé et valider notre modèle en le confrontant à des travaux existants.
Ces approches permettent d’assurer la fiabilité et la qualité de notre travail. Dans la figure 3, on observe un masque rocheux segmenté ainsi qu'une roche obtenue par assemblage d'images segmentées. Ce support servira de référence pour certifier et valider notre travail.
Florent, à quand une solution opérationnelle ?
[Florent] L'axe segmentation de SCHISM est déjà opérationnel et a été présenté comme démonstrateur. Les entraînements atteignent un taux de précision > 90%. Des évolutions sont prévues, notamment l'intégration complète du self-supervised learning pour réduire la dépendance aux données d'entraînement. Actuellement, l'utilisateur doit entraîner SCHISM avec des données spécifiques pour obtenir une segmentation précise, mais l'idée est d'évoluer vers un système auto-apprenant.
Concernant l’axe certification, les travaux sur l'automatisation de la certification des résultats nécessitent encore beaucoup de travail. Une version beta est néanmoins prévue courant second semestre 2024.
Et pour conclure, l'axe scanner synthétique est actuellement en phase de test. L'objectif est d'intégrer la génération de données synthétiques au projet principal.
Une mise à jour de SCHISM, incluant l’intégration du scanner synthétique, est prévue mi-2024 et prendra la forme d’un générateur automatique de scanner de roche. L’opérateur aura le contrôle des paramètres pétrophysiques. Le concept se fondera sur les architectures de Deep Learning GAN.