Segmentation Sémantique d'Images de Télédétection Combinant Modèles Graphiques Probabilistes Hiérarchiques et Réseaux de Neurones Convolutifs Profonds

In this paper, a novel method to tackle semantic segmentation of very high resolution remote sensing data is presented. Deep learning techniques, such as convolutional neural networks (CNNs) and fully convolutional networks (FCNs), have shown exceptional performances in this task. But the accuracy of their classification depends on the quantity and quality of the ground truth used to train them. On the other hand, probabilistic graphical models (PGMs) have sparked even more interest in the past few years, because of the ever-growing availability of very high resolution data and the correspondingly increasing need for structured predictions. The research themes proposed in this paper aim to link and combine different ideas of these approaches (deep learning and stochastic models) to develop new methods of classification of remote sensing images. In order to develop a pipeline combining deep learning and PGM to meet the growing need for precise semantic mapping in remote sensing images, two well-known deep learning architectures such as U-Net and SegNet were considered. The experimental validation was carried out with the “ISPRS 2D Semantic Labeling Challenge” data set on the city of Vaihingen, in some cases with some modifications, in order to approximate the ground truths common in real remote sensing applications, to assess whether the proposed method could improve the accuracy of classification in several cases. The results are significant, because the pipeline studied has a higher recall compared to the standard FCNs considered.

Dans cet article, une nouvelle méthode pour traiter la segmentation sémantique des données de télédétection à très haute résolution est présentée. Les progrès récents de l’apprentissage profond, en particulier les réseaux de neurones convolutifs et les réseaux entièrement convolutifs, ont montré des performances exceptionnelles dans cette tâche.Mais, comme pour les autres méthodes, la précision de la classification dépend de la quantité et de la qualité de la vérité de terrain utilisée pour les entraîner. Dans le même temps, les modèles de graphes probabilistes (PGMs) ont suscité beaucoup d’intérêt au cours des dernières années, en raison de la disponibilité toujours croissante des données à très haute résolution et, en conséquence, du besoin plus important de prévisions structurées. Les thèmes de recherche proposés dans cet article visent à relier et à combiner différents aspects de ces approches (modèles d’apprentissage profond et stochastiques) pour développer de nouvelles méthodes de classification d’images de télédétection.Afin de développer un pipeline mêlant apprentissage en profondeur et PGMs pour répondre au besoin croissant de cartographie sémantique précise dans les images de télé-détection, deux architectures d’apprentissage bien connues telles que U-Net et SegNet ont été considerées. La validation expérimentale est menée avec l’ensemble de données “ISPRS 2D Semantic Labelling Challenge” sur la ville de Vaihingen, dans certains cas avec quelques modifications.Ceci afin de simuler les vérités de terrain courantes dans les applications réelles de télédétection, pour évaluer si la méthode proposée pouvait apporter des améliorations à la précision de la classification. Les résultats sont significatifs, car le pipeline étudié a un score de “rappel” plus élevé par rapport aux réseaux entièrement convolutifs standard considérés

Mots clés

remote sensing semantic segmentation probabilistic graphical models convolutional neural networks multiresolution images

réseaux de neurones convolutifs modèles graphiques probabilistes segmentation sémantique Télédétection images multi résolutions

Domaines

Informatique [cs] Vision par ordinateur et reconnaissance de formes [cs.CV]

Fichier principal

Pastorino_Martina_ORASIS2021_final.pdf (1.15 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

CCSD Sciencesconf.org : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03339665

Soumis le : jeudi 9 septembre 2021-15:41:20

Dernière modification le : lundi 26 février 2024-11:22:14

Archivage à long terme le : samedi 11 décembre 2021-07:25:36

Dates et versions

hal-03339665 , version 1 (09-09-2021)

Identifiants

HAL Id : hal-03339665 , version 1

Citer

Martina Pastorino, Gabriele Moser, Sebastiano B. Serpico, Josiane Zerubia. Segmentation Sémantique d'Images de Télédétection Combinant Modèles Graphiques Probabilistes Hiérarchiques et Réseaux de Neurones Convolutifs Profonds. ORASIS 2021 - 18èmes Journées francophones des jeunes chercheurs en vision par ordinateur, Centre National de la Recherche Scientifique [CNRS], Sep 2021, Saint Ferréol, France. ⟨hal-03339665⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INRIA ORASIS2015 INRIA2 UNIV-COTEDAZUR IDEX-UNIV-COTEDAZUR ANR ORASIS2021

305 Consultations

424 Téléchargements