Vincent GODARD

Département de Géographie

Université de Paris 8


V.1.4 1- Dernière mise à jour : 05/09/2012

Fiche Guide du TP n°4.4 du cours de Télédétection niveau 2 :

(avec l'autorisation du Clark Labs - exercice librement inspiré du didacticiel d'Idrisi32 par Michelle GIBOIRE - adaptation Vincent GODARD)

 

Classifications non supervisées

 

Objectifs : classificlassificationss pixels d'une image satellitale sur les caractéristiques statistiques dominantes d'une image

 

Fonctions décrites dans ce TD : COMPOSITE, CLUSTER, HISTO, ASSIGN,

 

 

Les classifications non supervisées sont une autre technique de classification d'images. Dans l'approche non supervisée, les réponses spectrales dominantes sont extraites puis identifiées à l'aide des données de terrain. Dans Idrisi, les classifications non supervisées sont proposées dans deux modules CLUSTER et ISOCLUST. Dans cet exercice on verra le module CLUSTER.

CLUSTER utilise la technique de sélection des pics des différents histogrammes des images à traiter. C'est le même principe que la recherche des pics dans un histogramme mono dimensionnel, où un pic est défini comme une valeur avec une plus grande fréquence que son environnement (de part et d'autre). Une fois les différents pics identifiés, toutes les valeurs semblables sont affectées au plus proche. Ainsi, les séparations entre les classes tendent à se situer à mi distance entre les pics. Comme la technique utilise des critères spécifiques pour constituer des pics, vous n'avez pas à estimer, à priori, le nombre de classes contenues dans l'image. Il le fait pour vous.

Les compositions colorées ont été introduites à la fin de la fiche guide 4.1. CLUSTER travaille sur le résultat des composition colorée en 8 bits. Le format des compositions colorées en 8 bits combine trois bandes en entrée de manière à produire une image étalée entre la valeur 0 et la valeur 215 en sortie. Chaque valeur représente la combinaison particulière des valeurs (étalées dynamiquement) des trois bandes en entrée. On pourra, à ce sujet, consulter l'aide en ligne de la fonction COMPOSIT d'Idrisi.

CLUSTER évalue un histogramme tri-dimensionnel composé des trois bandes d'imagerie présent dans une composition colorée. N'importe quelle combinaison d'images issue de COMPOSIT peut être utilisé. Comme nous l'avons vu avec les exercices (Fiche guide 4.3) sur les Analyses en composantes principales, les bandes du proche infra rouge, de rouge et du vert (composition colorée en fausses couleurs) concentre l'essentiel de l'information contenue dans les sept bandes du jeux de données des How Hill. Nous allons de nouveau utiliser ces données.

 

a) Vérifiez que les préférences d'affichage sont les même que dans le précédent exercice.

Allez sous File/User Preferences et pour les paramètres d'affichage

- Cochez affichage automatique avec :

- Titre ;

- Légende.

 

b) Exécutez COMPOSITE depuis le menu

Image Processing/Enhancement

- Spécifiez :

- H87TM2 => bande bleue ;

- H87TM3 => bande verte ;

- H87TM4 => bande rouge.

Notez que l'on n'utilise pas la bande 1, la bande bleue du visible, ce qui décale toutes les affectations de couleurs. C'est ce qu'on appelle une composition colorée an fausses couleurs (False Color Composite).

- Appelez le résultat H87FCC (False Color Composite)

- Choisissez une saturation avec un étalement linéaire de la dynamique (Linear with saturation points)

- Créez une composition colorée en 8 bits

- N'omettez pas le zéro du stretch ;

- Saturez à 2.5%.

Les meilleurs résultats sont en général obtenus avec un étalement compris entre 1 et 2,5 %.

- Écrivez un titre et validez par OK.

Notez que : les compositions colorées en 8 bits sont toujours affichées avec la palette de Composition colorée (Color Composite).

 

c) Exécutez CLUSTER depuis le menu

Image Processing/Hard Classifiers

- Spécifiez => H87FCC comme nom de composition colorée (composite) ;

- Nommez l'image de sortie => BROAD.

- Choisir :

- le niveau de généralisation le plus large (Broad)

- de laisser tomber les groupes les moins significatifs (Drop the least significant clusters)

Le résultat, BROAD, s'affiche avec la palette Qualitative.

d) Pour faciliter l'analyse visuelle de cette image, vous pouvez souhaiter employer l'option de vision "instantanée" des catégories. Placez le curseur sur un caisson de légende ; puis pressez et relâchez le bouton gauche de la souris. Ceci affichera la catégorie en rouge, alors que les autres catégories seront affichées en le noir. Relâcher le bouton de souris, libère l'affichage qui redevient normal.

C'est donc une image du secteur d'étude avec des classes spectrales très larges.

1) Combien de groupes "larges" ont été produits ? Donnez votre interprétation du secteur à partir de l'exercice sur les classifications dirigées (cf. 4.1.). Quelles sont les classes d'occupation du sol représentées par chacun des groupes ?

Les niveaux larges et fins de généralisation emploient différentes règles de décision en évaluant les pics de l'histogramme de fréquence. Pour les groupements "larges", un pic doit contenir une fréquence plus élevée que tous ses voisins latéraux. La classification fine permet à une classe d'être centrée sur un pic voisin d'un autre pic ayant une fréquence plus élevée. Ceci s'applique aux pics intermédiaires qui sinon sont masqués par des pics d'une plus grande magnitude. Ce concept est illustré dans l'espace unidimensionnel de la figure 1. Les groupes larges sont séparés par des vallées. Les groupes fins sont divisés par les vallées et par les ruptures de pente de l'histogramme.

fig. 1 - Histogramme

 

e) Relancez CLUSTER à nouveau, avec H87FCC comme composition colorée, pour créer une image appelée FINE. Cette fois, employez le niveau fin de généralisation, et choisissez encore, de laisser tomber les groupes les moins significatifs. Comme vous pouvez le voir, la généralisation fine produit beaucoup plus de groupes. Faites défiler la légende ou augmentez la taille de la boîte de légende pour voir combien de groupes sont présents.

2) Combien de groupes ont été produits ? Quels groupes sont les plus facilement identifiés ? Expliquez pourquoi ?

 

f) Les histogrammes nous permettent de voir la différence dans la distribution des pixel parmi des classes dépendant du niveau de généralisation.

- Exécutez HISTO depuis le menu Display

ou à l'aide de l'îcone suivante

pour créer un histogramme de FINE.

Dans le résultat du module CLUSTER, le Groupe 1 est toujours celui avec la fréquence de pixels la plus élevée. Il correspond à la plus grande classe d'occupation du sol détectée lors des classifications. Le deuxième groupe a un plus petit nombre de pixels et ainsi de suite.

Notez que : les groupes aux numéros les plus élevés ont relativement peu de pixels. Une approche fréquente consiste à rechercher des seuils naturels dans l'histogramme des groupes "fins" pour estimer le nombre de classes significatives dans le secteur d'étude. Une fois déterminé, il faut relancer le module CLUSTER, en indiquant, cette fois, le nombre de groupes à identifier. Tous les Pixel restants sont assignés au groupe auquel ils sont les plus semblables. (notez que ce ne serait pas une bonne approche que de rechercher spécifiquement un type d'occupation du sol peu couvrant).

 

g) Observez l'histogramme de FINE. Notez que le secteur d'étude est dominé par deux groupes. Plusieurs paliers dans l'histogramme pourraient être choisis comme seuils. Il est possible de limiter le nombre de groupes à 7 ou à 14 en fonction des ruptures dans la distribution. Pour la facilité de l'interprétation et en l'absence d'information de vérité terrain, nous choisirons de garder les 7 premiers groupes en tant que types significatifs d'occupation du sol.

 

h) Relancez CLUSTER avec de nouveau H87FCC.

- Nommez le fichier sortie => FINE7

- Choisir :

- le niveau de généralisation le plus fin (Fine)

- le nombre maximum des groupes à 7 (Set maximum number of clusters)

Le problème est maintenant d'analyser ces groupes. Lorsque la région est connue, il est plus facile d'interpréter les groupes étendus. Les groupes fins, en revanche, peuvent prendre une quantité considérable de signification. Les cartes existantes, les photographies aériennes et les contrôles de terrain sont indispensables pour identifier correctement les groupes les plus fins. En outre, nous trouverons souvent qu'il est nécessaire de fusionner certaines classes pour produire la carte finale. Par exemple, on constate qu'une classe représente les forêts de pin sur les pentes ombragées tandis qu'une autre représente la forêt de pin sur les pentes éclairées. Ce sont deux classes spectrales distinctes. Cependant, dans la carte finale, nous voulons les réunir ensembles pour faire une seule classe "forêt de pin". Pour regrouper et attribuer ces classes il faut utiliser le module ASSIGN.

 

i) Essayez d'interpréter les 7 groupes de FINE7. Pour cela, comparez FINE7 aux sorties de la classification dirigée créés dans l'exercice 4.2. (MINDISTNORMAL et MAXLIKE). Il peut également être utile de regarder les bandes originales ou les compositions colorées (créez des compositions colorées 24-bit pour un meilleur effet visuel) pour déterminer quelle couverture est représenté par tel groupe. Quand vous aurez déterminé à quelle catégorie chaque groupe doit être assigné, employez Edit pour écrire cette information dans un fichier attributs (Attribute values file) que vous appellerez LANDCOVER. Le numéro des groupes doit être énuméré dans la première colonne et les catégories d'occupation du sol dans la deuxième colonne. Laissez par défaut le type de données entier.

3. Quelles sont vos classes d'occupation du sol ?

La permutation des canaux peut donner un nombre de classes différent. Cela est dû à l'algorithme de la fonction CLUSTER qui utilise exclusivement les compositions colorées de COMPOSIT en 8 bits. Le détail des combinaisons est expliqué en annexe 1 à la fonction COMPOSIT.

 

j) Utilisez ASSIGN pour créer la nouvelle image d'occupation du sol.

- Appelez le fichier :

- de définition des objets => FINE7 ;

- attribut => LANDCOVER ;

- Appelez l'image de sortie LANDCOVER.

- Affichez-la avec la palette qualitative (Qualitative palette) ;

- Employez Metadata pour ajouter une légende significative à LANDCOVER ;

- Sauvegardez.

- Réaffichez LANDCOVER pour voir la nouvelle légende.

 

La classification non supervisée par la méthode CLUSTER permet de décrire très rapidement un secteur d'étude. La classification est le plus souvent un processus itératif où chaque étape apporte de nouvelles informations que l'analyste peut employer pour améliorer son résultat. Souvent, des classifications dirigées et non supervisées sont employées ensemble dans des approches hybrides. Par exemple, dans FINE7, le groupe 3 est difficile à interpréter, pourtant c'est la troisième classe spectrale en importance dans le secteur d'étude. Ceci pourrait nous indiquer qu'une catégorie d'occupation du sol (par exemple les zones humides) a été laissée de côté lors des classifications dirigées. Nous pourrions alors retourner et créer une zone d'entraînement et une signature pour cette classe et reclassifier l'image en utilisant les classificateurs dirigés. Les groupes d'une analyse non supervisée peuvent également être employés comme zones d'entraînement pour constituer les signatures d'une future classification dirigée. La chose importante à noter est qu'une classification n'est jamais un processus unique.

En conclusion, aucune classification n'est complète sans l'évaluation de son exactitude. Cette évaluation indique le niveau de confiance à accorder à la carte d'occupation du sol issue des classifications. Cela peut également fournir des informations pour améliorer les classifications. Le chapitre sur les classifications d'images satellitales d'Idrisi (Classification of Remotely Sensed Images dans le IDRISI Guide to GIS and Image Processing Volume 2) décrit ce processus important.

Dans cet ensemble d'exercices, nous nous sommes concentrés sur les classificateurs "durs" (hard classifiers). Les classificateurs "souples" (soft classifiers), qui retarde l'attribution de chaque pixel à une classe, sont décrits dans ce tutoriel au chapitre Advanced Image Processing.

 

Retour au début de la fiche Guide

 

Fiche Guide suivante

 

NB : les mots suivis de "*" font partie du vocabulaire géographique, donc leur définition doit être connue. Faites-vous un glossaire.