Manque d'exemples pour entrainer vos modèles ? Essayer le Modèle pré-entraîné d'interprétation intelligente d'images de télédétection

03 November,2023 108

Avec les avantages de la technologie d'apprentissage profond dans le domaine de l'interprétation d'images de télédétection,  les modèles d'apprentissage profond sont de plus en plus utilisés dans les travaux d'interprétation d'images de télédétection. L'entraînement d'un modèle de Deep Learning idéal nécessite une grande quantité d'échantillons de données. Cependant, la situation réelle est que les utilisateurs ne disposent souvent pas de suffisamment de données d'échantillonnage pour effectuer une interprétation intelligente de la télédétection, ou ne disposent que d'une petite quantité de données d'échantillonnage, ce qui entraîne de mauvaises performances du modèle. Pour résoudre ce problème, les modèles pré-entraînés sont un outil efficace. Le modèle pré-entraîné est un modèle d'apprentissage profond entraîné sur la base d'une grande quantité de données d'échantillon de haute qualité, ciblant souvent des tâches spécifiques telles que l'extraction d'objets de surface spécifiques (tels que des terres cultivées et des bâtiments), la distinction de types d'objets de surface spécifiques (tels que la  classification de l'utilisation/de la couverture des sols), la détection de cibles d'objets de surface spécifiques (telles que des avions, des navires) et la détection de changements dans des objets de surface spécifiques (tels  que les changements de route).

Quels modèles pré-entraînés SuperMap fournit-il?

  • Modèle pré-entraîné d'interprétation d'images de télédétection

L'entraînement des modèles nécessite non seulement des données de haute qualité, mais consomme également beaucoup de temps et de ressources informatiques. Afin de réduire les coûts  pour les utilisateurs et de satisfaire les exigences de l'interprétation d'images de télédétection, SuperMap fournit plusieurs modèles pré-formés couramment utilisés : modèle d'extraction de bâtiments urbains, modèle d'extraction de plans d'eau urbains, modèle d'extraction de terres cultivées, modèle d'extraction de serre, modèle de reconnaissance d'  avions, modèle d'identification de navires. Ces 6 modèles peuvent tous être utilisés pour analyser des  images en lumière visible haute résolution.

▲ Modèle pré-entraîné d'interprétation intelligente de l'image de télédétection SuperMap

Parmi eux, le modèle d'extraction de bâtiments urbains et le modèle d'extraction de plans d'eau urbains ont été optimisés en termes  de structure du modèle et de données d'entraînement basées sur la version V1 précédente. Par exemple, le modèle d'extraction de bâtiments urbains utilise le modèle SegFormer nouvellement ajouté dans la version 2023. SegFormer est le produit de l'introduction de Transformers dans des tâches de segmentation sémantique, en tenant compte de l'effet, de l'efficacité et de la robustesse. Il s'agit d'un cadre de segmentation simple, efficace mais puissant. Par rapport à la version V1 entraînée avec le modèle SFNet, l'effet d'extraction a été grandement amélioré.

▲Comparaison entre les modèles d'extraction de bâtiments urbains V1 et V2

  • SAM grand modèle

En avril 2023, Meta a publié le Segment Anything Model (SAM), un grand modèle de vision par ordinateur. Le modèle est entraîné avec plus d'un milliard d'étiquettes et peut effectuer une segmentation des images en un clic, ce qui constitue la base d'une interprétation intelligente de la télédétection.

SAM est sans entraînement avec une généralisation élevée. Cependant, la segmentation des images par tous les éléments du modèle ne contient pas d'informations sémantiques. De plus, ses données d'apprentissage ne sont pas un ensemble de données dans le domaine vertical de la télédétection, et il est difficile de s'adapter à de multiples échelles de télédétection sans invites et interactions. Par conséquent, SuperMap adopte une solution de détection de cible + segmentation SAM, qui utilise des algorithmes de détection de cible tels que Cascade RCNN pour fournir des invites de boîte cible, puis utilise SAM pour générer des masques de segmentation d'instance pour chaque cible.

▲Plan de segmentation SAM : segmentation des objets au sol sur l'ensemble de la zone (à gauche) et segmentation des objets au sol spécifiés (à droite)

Comment utiliser le modèle pré-entraîné ?

  • Prêt à l'emploi - aucune formation n'est requise pour économiser votre main-d'œuvre

Pour le « modèle pré-entraîné », si le scénario d'application est adapté, nous pouvons l'appliquer directement à l'image d'inférence, éliminant ainsi le processus complexe de préparation des données d'entraînement, de production et d'entraînement du modèle. Il vous suffit d'utiliser l'outil d'inférence de modèle correspondant, d'entrer l'image à déduire et le modèle pré-entraîné, et l'image peut être extraite en tant que résultat d'interprétation. L'inférence de modèle est implémentée dans le produit de bureau SuperMap (SuperMap iDesktopX), les produits de composants (SuperMap iObjects Python) et le produit serveur (SuperMap iServer). Il prend en charge la sélection flexible de  plusieurs formes d'entrée telles que des fichiers d'image uniques, des dossiers d'images, des mosaïques, des services d'imagerie, etc., et prend en charge l'inférence de plage spécifiée.

▲Modèle pré-entraîné « prêt à l'emploi »

  • Apprentissage par transfert - amélioration de la généralisation des modèles pré-entraînés

Le modèle pré-entraîné se concentre sur les objets du sol communs pour l'interprétation d'images de télédétection, mais dans les applications pratiques, il existe souvent des besoins plus spécifiques. Par exemple, le modèle d'extraction des bâtiments urbains actuellement fourni donne de bons résultats d'extraction pour des bâtiments ayant des caractéristiques de forme et de distribution différentes dans l'arrière-plan urbain ; Cependant, il y a encore place à l'amélioration de la précision de l'extraction pour  les groupes de petits bâtiments dans les zones suburbaines. Face à de telles exigences d'application, l'apprentissage par transfert peut être utilisé.

L'apprentissage par transfert est un domaine de l'apprentissage automatique qui applique les connaissances acquises lors de la résolution d'un problème à un autre problème similaire. Pour les exemples ci-dessus, une petite quantité de données d'apprentissage des bâtiments de banlieue peut être utilisée pour affiner les paramètres du modèle d'extraction de bâtiments urbains par le biais de l'apprentissage par transfert afin d'obtenir un nouveau modèle d'extraction de bâtiments de banlieue. Par rapport à l'entraînement d'un modèle d'extraction de bâtiments de banlieue à partir de zéro, l'apprentissage par transfert nécessite moins de données d'apprentissage, de sorte que de nouveaux modèles qui répondent aux besoins des applications peuvent être rapidement obtenus.

▲Processus d'apprentissage par transfert

L'utilisation de la technologie d'apprentissage profond a considérablement amélioré l'efficacité de l'interprétation des images de télédétection, et le coût des données, le coût du temps et le coût de la puissance de calcul requis pour l'entraînement des modèles d'apprentissage profond sont également des questions qui ne peuvent être ignorées dans les applications pratiques. Afin de réduire les coûts pour les utilisateurs, SuperMap fournit des modèles de pré-entraînement pour l'interprétation intelligente des images de télédétection. En plus des six modèles couramment utilisés présentés dans cet article, SuperMap continuera à l'avenir à fournir des modèles de  pré-entraînement pour différentes tâches et différents objets au sol, et mettra également à  niveau et optimisera les modèles existants, dans l'espoir d'aider davantage d'utilisateurs à effectuer efficacement des tâches d'interprétation d'images de télédétection.


Tags:

Más Articles