Test du chi-deux et mesure de l`indépendance locale entre pixels
Transcription
Test du chi-deux et mesure de l`indépendance locale entre pixels
Test du chi-deux et mesure de l'indépendance locale entre pixels Application à la reconnaissance de textures André SMOLARZ Institut des Sciences et Technologies de l'Information de Troyes (ISTIT)) Université de Technologie de Troyes (UTT) 12, rue marie Curie BP 2060 10010 Troyes Cedex [email protected] RÉSUMÉ. Nous proposons un nouvel ensemble d'attributs de texture reposant sur une mesure de dépendance (ou d'indépendance) locale entre un pixel et ses voisins dans les quatre directions principales. Le modèle proposé permet, au moyen du test du Chi-deux, de caractériser les aspects aléatoire et isotrope de la texture. La modélisation porte sur la distribution de la proximité de niveau de gris entre un pixel et ses voisins. Nous considérons les cas de l'indépendance stricte et de l'indépendance conditionnelle des pixels voisins relativement au pixel central. ABSTRACT. We propose a new set of texture features based on a measure of local dependance between a pixel and its neighbours. The model allow us to characterize the random and isotropic aspects of the texture by the way of the Chi-Deux test. This model is based on the gray level dependance distribution and we consider the cases of, the strict and the conditionnal independance. MOTS-CLÉS texture, modélisation, test du Chi-Deux, estimation, reconnaissance des formes statistique KEYWORDS: texture, modelisation, Chi-Deux test, estimation, statistical pattern recognition 1. Introduction L'approche proposée repose sur une modélisation de la distribution de la proximité de niveau de gris entre un pixel et ses voisins. Les distributions sont estimées au moyen des matrices de dépendance de niveaux de gris voisins, (NGLDM), proposées par Sun et al., (1983) et complétées par Berry et al., (1991). Des travaux précédents de Smolarz, (2003a, 2003b) ont permis de montrer qu'il était possible de caractériser l'anisotropie d'une texture en évaluant la dépendance locale entre un pixel et ses voisins au moyen d'un test du Chi-Deux. L'intérêt de ces attributs réside dans le fait qu'ils permettent d'interpréter les proximités ou les distances entre textures. De bons résultats ont été obtenus sur des textures markoviennes ainsi que sur des textures naturelles. Cependant les calculs d'attributs ont été effectués sur des images entières de texture dont la taille était suffisante (typiquement 2562 pixels) pour permettre une bonne estimation du modèle de dépendance spatiale. Si l'on souhaite maintenant utiliser ces attributs de façon plus locale afin de détecter les textures multiples qui peuvent composer une image, le problème de l'estimation des matrices NGLDM devient crucial pour pouvoir évaluer la dépendance locale. C'est ce problème que nous avons étudié et nous présentons ici quelques résultats qui sont encourageants pour une approche de type reconnaissance de textures. Dans la partie suivante nous rappellerons brièvement l'approche globale initiale (Smolarz 2003b) avant de présenter les adaptations nécessaires à son utilisation au niveau local sur des fenêtres de taille réduite. Dans la troisième partie, nous présenterons les résultats obtenus sur quelques textures markoviennes et naturelles, puis nous concluerons. 2. Présentation du modèle Rappelons tout d'abord les notations utilisées puis la définition de la matrice NGLDM et enfin le modèle que l'on peut établir sous hypothèse d'indépendance locale. • Notations G(l,c) variable aléatoire associée au niveau de gris du pixel de coordonnées (l,c) G est définie sur l'ensemble E={ 1, 2, …Ng} d : Paramètre de distance fixant l'étendue du voisinage autour du pixel central. Vd : Voisinage d'un pixel (forme variable selon que l'on a un voisinage isotrope ou non). ( ) N = Card V d d a : Paramètre fixant le degré de proximité tonale entre niveaux de gris de pixels voisins. S : Variable aléatoire associée au nombre de voisins d'un pixel qui sont en proximité tonale avec ce pixel. • Matrice NGLDM Pour simplifier les notations, nous noterons Q la matrice NGLDM définie par : [ { Qd,a (g,s) = Card (l,c) G (l,c) = g et Card (i, j) (i, j) ∈ Vd et G (l,c) − G (i, j) ≤ a ] = s} Sur la base de la matrice Q, on peut estimer la probabilité conditionnelle Pd, a (S = s / G = g) par : Nd ^ Pd, a (S = s / G = g) = Qd, a (g ,s) / ∑Q d, a (g , u) u =0 • Modèle Pd, a (S = s / G = g) est la distribution, conditionnellement au niveau de gris g d'un pixel, du nombre s de ses voisins ayant un niveau de gris compris entre g-a et g+a. Sous l'hypothèse que les pixels appartenant au voisinage sont indépendants, la probabilité Pd, a (S = s / G = g) est modélisée par la loi binomiale. Nous avons considéré deux cas d'indépendance, l'indépendance stricte et l'indépendance conditionnelle des pixels voisins relativement au niveau de gris du pixel central. cas N° 1 : Hypothèse d'indépendance stricte La loi Pd, a (S = s / G = g) est une loi binomiale de paramètres ( Nd et p1 = P g − a ≤ G ≤ g + a ) cas N° 2 : Hypothèse d'indépendance conditionnelle La loi Pd, a (S = s / G = g) est une loi binomiale de paramètres Nd Nd et p2 = ∑ u =1 Nd u ⋅ Qd, a (g , u) / [N ⋅ ∑ Q d, a (g d ] , u) u =0 Dans les deux cas ci-dessus, le test est effectué en calculant la distance du test du Chi-Deux pour chaque niveau de gris g, (p1 et p 2 dépendent de g). On calcule ensuite la différence D(g) entre la distance du Chi-Deux et le seuil de décision χ2α (g) obtenu pour un risque de première espèce α de 5%. Le seuil dépend de g par le biais de son degré de liberté qui peut varier quand on prend en compte les contraintes d'effectif de classes relatives au test du Chi-Deux. Le critère final C est égal à la moyenne sur g de D(g) et s'il est négatif, on admet l'hypothèse d'indépendance. Afin de prendre en compte l'anisotropie éventuelle des textures nous avons effectué 4 tests d'indépendance reposant sur des voisinages relatifs aux 4 directions principales (0°, 90°, 45° et 135°). Pour chaque texture étudiée et pour chaque cas d'indépendance, nous disposons donc de 4 mesures du critère que nous noterons C 0, C90 C45, C135. Afin que les 4 critères puissent être comparables, nous les avons normalisés en les divisant par la somme de leurs valeurs absolues et c'est ce qui fournit les attributs de texture soit fθ = Cθ C0 + C90 + C45 + C135 (pour θ = 0, 90, 45 et 135). Toutes les valeurs sont donc ramenées à l'intervalle [-1 , 1]. Lorsque les 4 valeurs sont proches de 0.25, cela signifie que l'on a une texture isotrope avec une forte dépendance locale de voisinage. A l'inverse, 4 valeurs égales à -0.25 caractérisent une image de bruit. Une valeur fortement positive pour l'un des 4 coefficients, le sera au détriment des 3 autres et indiquera une forte dépendance dans la direction concernée. Les résultats antérieurs présentés dans Smolarz (2003b), montrent que ces attributs permettent de capter l'anisotropie d'une texture. 3. Résultats Dans le cadre d'une approche de type reconnaissance de formes, il faut envisager le calcul des attributs sur des fenêtres d'images. Dans ce contexte, afin d'obtenir une estimation correcte des matrices NGLDM, nous avons été contraints de réduire le nombre de niveaux de gris à 32 par une égalisation d'histogramme. Nous présentons quelques résultats obtenus pour un ensemble constitué de 15 textures markoviennes (figure 2) obéissant à un modèle auto binomial, (Cross & Al. (1983), Smolarz (1997)) ainsi que sur un ensemble de 8 textures naturelles (figure 1). Deux images de bruit ont été prises en compte comme références de l'indépendance isotrope, l'image U est un bruit uniforme et G est un bruit gaussien. Les meilleurs résultats de classification ont été obtenus avec d=2 et a=5 en prenant les 8 attributs (4 pour l'indépendance stricte et 4 pour l'indépendance conditionnelle). Les images étudiées avaient une taille de 256x256 pixels et les attributs ont été estimés sur des fenêtres de tailles 32x32 pixels, soit 64 fenêtres par image. Pour chaque image à classer nous avons choisi 32 fenêtres pour l'apprentissage et les 32 restantes pour le test. Une fenêtre est affectée à la classe de texture dont elle est la plus proche au sens de la distance de Mahalanobis. Le tableau 1 représente les matrices de confusion obtenues sur les textures markoviennes et le tableau 2, celles obtenues sur les textures naturelles. Pour les deux types de textures (naturelles ou non), les erreurs de classification sont assez importantes, mais il est intéressant de noter que, pour une texture donnée (lignes de la matrice de confusion) les fenêtres mal classées, sont affectées à des textures (colonnes de la matrice de confusion) qui présentent beaucoup de similitudes structurelles avec la texture considérée. Ainsi, le bois est principalement confondu avec l'eau, le canevas avec la laine, l'herbe avec la laine, ces textures présentent une anisotropie de même nature. Pour les textures markoviennes il est possible de faire les mêmes remarques. Cet aspect a été très peu abordé dans les travaux relatifs à la caractérisation et à la reconnaissance de textures et, de ce point de vue, les résultats obtenus ici sont encourageants. Il est en effet possible d'envisager, par exemple, de choisir la forme du voisinage la plus apte à caractériser localement une texture, il est également possible de guider la reconnaissance ou la recherche de textures sur des critères de structure directionnelle. 4. Conclusions et perspectives Les résultats présentés ici sont encourageants et laissent envisager la possibilité de définir de nouveaux attributs pour la reconnaissance de la texture. Comme nous l'avons évoqué dans la partie précédente, il est possible d'envisager l'utilisation de ces attributs pour représenter la structure locale d'une texture ou de définir des classes de textures afin de faciliter leur recherche ou leur identification. Dans cette perspective, nous envisageons de tester la sensibilité de cette approche à ce que l'on pourrait nommer l'échelle de l'anisotropie. Par exemple, les textures markoviennes 31 à 34 forment la classe des textures orientées selon la seconde diagonale avec un effet croissant de concentration spatiale des niveaux de gris proches, cela a pour effet d'engendrer des structures ou des motifs d'échelles plus fines. De même les textures 41 à 44 forment la classe "horizontale" et les textures 51 à 56 la classe "isotrope". Toutefois cette étude ne peut se faire sans chercher à optimiser le modèle et en particulier les choix des paramètres a et d qui ont été faits ici de manière arbitraire. Il est clair que la valeur de a doit être choisie en fonction du nombre de niveaux de gris de l'image. Le paramètre d, quant à lui semble moins critique car pour les textures microscopiques, les caractéristiques locales ne s'étendent pas au delà de quelques pixels. Enfin, il nous semble intéressant d'étudier le comportement d'autres modèles de distributions locales qui permettraient d'estimer les dépendances locales de façon efficace sur des fenêtres de petite taille en évitant tout pré-traitement comme l'égalisation d'histogramme qui constitue une perte d'information. 5. Bibliographie Berry J.R., Goutsias J., (1991) "A comparative study of matrix measures for maximum likelihood texture classification", IEEE trans. SMC, Vol. 21 N°1, pp 252-261 Cross G.R & A.K Jain, (January 1983) " Markov Random Field Models" IEEE Trans. Pattern Analysis & Machine Intelligence, Vol PAMI-5 N°1, pp 25-39, Smolarz A., .,(1997) "Etude qualitative du modèle Auto-Binomial appliqué à la synthèse de texture". XXIXèmes journées de Statistique 26-30 mai Carcassonne. pp 712-715 Smolarz A, .,(2003a) "Modélisation des caractéristiques locales de voisinage dans les images de textures". XXXVèmes journées de Statistique, Lyon 2-6 juin 2003. Smolarz A, .,(2003b) "Evaluation de la dépendance spatiale locale pour la caractérisation de textures". 19ème colloque GRETSI sur le traitement du signal et des images, Paris 8-11 Septembre 2003 Sun C., Wee W. G., (1983) "Neighboring gray level dependence matrix for texture classification", CVGIP, N°23, pp 341-352 Bois Bulles Herbe Laine Sable Canevas Eau Lierre Figure 2 : Textures Naturelles 11 12 21 31 32 33 34 41 42 43 44 51 52 55 56 Figure 2 : Textures Markoviennes classement des fenêtres d'apprentissage U G 11 12 21 31 32 33 34 41 42 43 44 51 52 55 56 U 23 7 G 3 17 11 12 32 1 31 21 erreur totale = 31 32 21 5 11 24 34 23,53% 41 31 42 43 44 51 52 55 6 8 56 1 1 1 32 1 32 1 1 3 1 19 6 4 15 2 1 2 1 1 2 27 1 2 1 1 3 4 1 1 8 2 1 7 12 13 13 29 32 2 3 2 1 31 classement des fenêtres test U G 11 12 21 31 32 33 34 41 42 43 44 51 52 55 56 33 U 13 1 G 7 6 erreur totale = 11 12 21 29 1 1 26 1 31 32 33 34 40,44% 41 42 43 44 51 52 55 12 16 56 1 31 4 1 13 11 11 19 1 5 1 4 1 31 32 4 2 8 3 6 5 3 2 1 1 12 1 12 11 7 3 1 1 1 2 1 1 1 8 6 2 4 5 1 4 8 11 9 27 16 29 3 2 1 1 1 29 Tableau 1 : Matrices de confusion sur les textures markoviennes. classement des fenêtres d'apprentissage U G bois bulle herbe laine sable canevas eau lierre U 29 7 G 3 25 erreur totale = bois bulle herbe laine 14 1 32 1 1 26 1 6 23 11 6 4 9 1 1 6 4 classement des fenêtres test U G bois bulle herbe laine sable canevas eau lierre U 23 20 G 9 12 bulle 1 9 6 5 1 2 26 5 9 1 1 herbe laine 19 2 5 1 4 10 15 18 11 10 6 28,75% canevas eau lierre 15 1 3 25 1 erreur totale = bois 1 sable sable 2 27 1 18 eau lierre 48,75% canevas 24 1 2 4 1 4 1 16 2 4 30 1 Tableau 2 : Matrices de confusion sur les textures naturelles. 14