Test du chi-deux et mesure de l`indépendance locale entre pixels

Transcription

Test du chi-deux et mesure de l`indépendance locale entre pixels
Test du chi-deux et mesure de l'indépendance locale entre pixels
Application à la reconnaissance de textures
André SMOLARZ
Institut des Sciences et Technologies de l'Information de Troyes (ISTIT))
Université de Technologie de Troyes (UTT)
12, rue marie Curie BP 2060 10010 Troyes Cedex
[email protected]
RÉSUMÉ. Nous proposons un nouvel ensemble d'attributs de texture reposant sur une mesure de
dépendance (ou d'indépendance) locale entre un pixel et ses voisins dans les quatre directions principales.
Le modèle proposé permet, au moyen du test du Chi-deux, de caractériser les aspects aléatoire et isotrope
de la texture. La modélisation porte sur la distribution de la proximité de niveau de gris entre un pixel et ses
voisins. Nous considérons les cas de l'indépendance stricte et de l'indépendance conditionnelle des pixels
voisins relativement au pixel central.
ABSTRACT. We propose a new set of texture features based on a measure of local dependance between a
pixel and its neighbours. The model allow us to characterize the random and isotropic aspects of the texture
by the way of the Chi-Deux test. This model is based on the gray level dependance distribution and we
consider the cases of, the strict and the conditionnal independance.
MOTS-CLÉS texture, modélisation, test du Chi-Deux, estimation, reconnaissance des formes statistique
KEYWORDS: texture, modelisation, Chi-Deux test, estimation, statistical pattern recognition
1. Introduction
L'approche proposée repose sur une modélisation de la distribution de la proximité de niveau de gris
entre un pixel et ses voisins. Les distributions sont estimées au moyen des matrices de dépendance de
niveaux de gris voisins, (NGLDM), proposées par Sun et al., (1983) et complétées par Berry et al., (1991).
Des travaux précédents de Smolarz, (2003a, 2003b) ont permis de montrer qu'il était possible de
caractériser l'anisotropie d'une texture en évaluant la dépendance locale entre un pixel et ses voisins au
moyen d'un test du Chi-Deux. L'intérêt de ces attributs réside dans le fait qu'ils permettent d'interpréter les
proximités ou les distances entre textures. De bons résultats ont été obtenus sur des textures markoviennes
ainsi que sur des textures naturelles.
Cependant les calculs d'attributs ont été effectués sur des images entières de texture dont la taille était
suffisante (typiquement 2562 pixels) pour permettre une bonne estimation du modèle de dépendance
spatiale. Si l'on souhaite maintenant utiliser ces attributs de façon plus locale afin de détecter les textures
multiples qui peuvent composer une image, le problème de l'estimation des matrices NGLDM devient
crucial pour pouvoir évaluer la dépendance locale. C'est ce problème que nous avons étudié et nous
présentons ici quelques résultats qui sont encourageants pour une approche de type reconnaissance de
textures.
Dans la partie suivante nous rappellerons brièvement l'approche globale initiale (Smolarz 2003b) avant
de présenter les adaptations nécessaires à son utilisation au niveau local sur des fenêtres de taille réduite.
Dans la troisième partie, nous présenterons les résultats obtenus sur quelques textures markoviennes et
naturelles, puis nous concluerons.
2. Présentation du modèle
Rappelons tout d'abord les notations utilisées puis la définition de la matrice NGLDM et enfin le modèle
que l'on peut établir sous hypothèse d'indépendance locale.
•
Notations
G(l,c) variable aléatoire associée au niveau de gris du pixel de coordonnées (l,c)
G est définie sur l'ensemble E={ 1, 2, …Ng}
d : Paramètre de distance fixant l'étendue du voisinage autour du pixel central.
Vd : Voisinage d'un pixel (forme variable selon que l'on a un voisinage isotrope ou non).
( )
N = Card V
d
d
a : Paramètre fixant le degré de proximité tonale entre niveaux de gris de pixels voisins.
S : Variable aléatoire associée au nombre de voisins d'un pixel qui sont en proximité tonale avec ce
pixel.
•
Matrice NGLDM
Pour simplifier les notations, nous noterons Q la matrice NGLDM définie par :
[
{
Qd,a (g,s) = Card (l,c) G (l,c) = g et
Card (i, j) (i, j) ∈ Vd et
G (l,c) − G (i, j)
≤ a
] = s}
Sur la base de la matrice Q, on peut estimer la probabilité conditionnelle Pd, a (S = s / G = g) par :
Nd
^
Pd, a (S = s / G = g) = Qd, a (g ,s)
/ ∑Q
d, a (g
, u)
u =0
•
Modèle
Pd, a (S = s / G = g) est la distribution, conditionnellement au niveau de gris g d'un pixel, du nombre s de
ses voisins ayant un niveau de gris compris entre g-a et g+a.
Sous l'hypothèse que les pixels appartenant au voisinage sont indépendants, la probabilité
Pd, a (S = s / G = g) est modélisée par la loi binomiale. Nous avons considéré deux cas d'indépendance,
l'indépendance stricte et l'indépendance conditionnelle des pixels voisins relativement au niveau de gris du
pixel central.
cas N° 1 : Hypothèse d'indépendance stricte
La loi Pd, a (S = s / G = g) est une loi binomiale de paramètres
(
Nd et p1 = P g − a ≤ G ≤ g + a
)
cas N° 2 : Hypothèse d'indépendance conditionnelle
La loi Pd, a (S = s / G = g) est une loi binomiale de paramètres
Nd
Nd et p2 =
∑
u =1
Nd
u ⋅ Qd, a (g , u)
/ [N ⋅ ∑ Q
d, a (g
d
]
, u)
u =0
Dans les deux cas ci-dessus, le test est effectué en calculant la distance du test du Chi-Deux pour chaque
niveau de gris g, (p1 et p 2 dépendent de g). On calcule ensuite la différence D(g) entre la distance du
Chi-Deux et le seuil de décision χ2α (g) obtenu pour un risque de première espèce α de 5%. Le seuil dépend
de g par le biais de son degré de liberté qui peut varier quand on prend en compte les contraintes d'effectif
de classes relatives au test du Chi-Deux.
Le critère final C est égal à la moyenne sur g de D(g) et s'il est négatif, on admet l'hypothèse
d'indépendance.
Afin de prendre en compte l'anisotropie éventuelle des textures nous avons effectué 4 tests
d'indépendance reposant sur des voisinages relatifs aux 4 directions principales (0°, 90°, 45° et 135°). Pour
chaque texture étudiée et pour chaque cas d'indépendance, nous disposons donc de 4 mesures du critère que
nous noterons C 0, C90 C45, C135.
Afin que les 4 critères puissent être comparables, nous les avons normalisés en les divisant par la
somme de leurs valeurs absolues et c'est ce qui fournit les attributs de texture soit
fθ =
Cθ
C0 + C90 + C45 + C135
(pour θ = 0, 90, 45 et 135). Toutes les valeurs sont donc ramenées à l'intervalle
[-1 , 1]. Lorsque les 4 valeurs sont proches de 0.25, cela signifie que l'on a une texture isotrope avec une
forte dépendance locale de voisinage. A l'inverse, 4 valeurs égales à -0.25 caractérisent une image de bruit.
Une valeur fortement positive pour l'un des 4 coefficients, le sera au détriment des 3 autres et indiquera une
forte dépendance dans la direction concernée. Les résultats antérieurs présentés dans Smolarz (2003b),
montrent que ces attributs permettent de capter l'anisotropie d'une texture.
3. Résultats
Dans le cadre d'une approche de type reconnaissance de formes, il faut envisager le calcul des attributs
sur des fenêtres d'images. Dans ce contexte, afin d'obtenir une estimation correcte des matrices NGLDM,
nous avons été contraints de réduire le nombre de niveaux de gris à 32 par une égalisation d'histogramme.
Nous présentons quelques résultats obtenus pour un ensemble constitué de 15 textures markoviennes
(figure 2) obéissant à un modèle auto binomial, (Cross & Al. (1983), Smolarz (1997)) ainsi que sur un
ensemble de 8 textures naturelles (figure 1). Deux images de bruit ont été prises en compte comme
références de l'indépendance isotrope, l'image U est un bruit uniforme et G est un bruit gaussien. Les
meilleurs résultats de classification ont été obtenus avec d=2 et a=5 en prenant les 8 attributs (4 pour
l'indépendance stricte et 4 pour l'indépendance conditionnelle). Les images étudiées avaient une taille de
256x256 pixels et les attributs ont été estimés sur des fenêtres de tailles 32x32 pixels, soit 64 fenêtres par
image.
Pour chaque image à classer nous avons choisi 32 fenêtres pour l'apprentissage et les 32 restantes pour
le test. Une fenêtre est affectée à la classe de texture dont elle est la plus proche au sens de la distance de
Mahalanobis. Le tableau 1 représente les matrices de confusion obtenues sur les textures markoviennes et
le tableau 2, celles obtenues sur les textures naturelles.
Pour les deux types de textures (naturelles ou non), les erreurs de classification sont assez importantes,
mais il est intéressant de noter que, pour une texture donnée (lignes de la matrice de confusion) les fenêtres
mal classées, sont affectées à des textures (colonnes de la matrice de confusion) qui présentent beaucoup de
similitudes structurelles avec la texture considérée. Ainsi, le bois est principalement confondu avec l'eau, le
canevas avec la laine, l'herbe avec la laine, ces textures présentent une anisotropie de même nature. Pour les
textures markoviennes il est possible de faire les mêmes remarques. Cet aspect a été très peu abordé dans
les travaux relatifs à la caractérisation et à la reconnaissance de textures et, de ce point de vue, les résultats
obtenus ici sont encourageants. Il est en effet possible d'envisager, par exemple, de choisir la forme du
voisinage la plus apte à caractériser localement une texture, il est également possible de guider la
reconnaissance ou la recherche de textures sur des critères de structure directionnelle.
4. Conclusions et perspectives
Les résultats présentés ici sont encourageants et laissent envisager la possibilité de définir de nouveaux
attributs pour la reconnaissance de la texture. Comme nous l'avons évoqué dans la partie précédente, il est
possible d'envisager l'utilisation de ces attributs pour représenter la structure locale d'une texture ou de
définir des classes de textures afin de faciliter leur recherche ou leur identification.
Dans cette perspective, nous envisageons de tester la sensibilité de cette approche à ce que l'on pourrait
nommer l'échelle de l'anisotropie. Par exemple, les textures markoviennes 31 à 34 forment la classe des
textures orientées selon la seconde diagonale avec un effet croissant de concentration spatiale des niveaux
de gris proches, cela a pour effet d'engendrer des structures ou des motifs d'échelles plus fines. De même
les textures 41 à 44 forment la classe "horizontale" et les textures 51 à 56 la classe "isotrope".
Toutefois cette étude ne peut se faire sans chercher à optimiser le modèle et en particulier les choix des
paramètres a et d qui ont été faits ici de manière arbitraire. Il est clair que la valeur de a doit être choisie en
fonction du nombre de niveaux de gris de l'image. Le paramètre d, quant à lui semble moins critique car
pour les textures microscopiques, les caractéristiques locales ne s'étendent pas au delà de quelques pixels.
Enfin, il nous semble intéressant d'étudier le comportement d'autres modèles de distributions locales qui
permettraient d'estimer les dépendances locales de façon efficace sur des fenêtres de petite taille en évitant
tout pré-traitement comme l'égalisation d'histogramme qui constitue une perte d'information.
5. Bibliographie
Berry J.R., Goutsias J., (1991) "A comparative study of matrix measures for maximum likelihood texture classification", IEEE
trans. SMC, Vol. 21 N°1, pp 252-261
Cross G.R & A.K Jain, (January 1983) " Markov Random Field Models" IEEE Trans. Pattern Analysis & Machine Intelligence,
Vol PAMI-5 N°1, pp 25-39,
Smolarz A., .,(1997) "Etude qualitative du modèle Auto-Binomial appliqué à la synthèse de texture". XXIXèmes journées de
Statistique 26-30 mai Carcassonne. pp 712-715
Smolarz A, .,(2003a) "Modélisation des caractéristiques locales de voisinage dans les images de textures". XXXVèmes journées de
Statistique, Lyon 2-6 juin 2003.
Smolarz A, .,(2003b) "Evaluation de la dépendance spatiale locale pour la caractérisation de textures". 19ème colloque GRETSI sur
le traitement du signal et des images, Paris 8-11 Septembre 2003
Sun C., Wee W. G., (1983) "Neighboring gray level dependence matrix for texture classification", CVGIP, N°23, pp 341-352
Bois
Bulles
Herbe
Laine
Sable
Canevas
Eau
Lierre
Figure 2 : Textures Naturelles
11
12
21
31
32
33
34
41
42
43
44
51
52
55
56
Figure 2 : Textures Markoviennes
classement des fenêtres d'apprentissage
U
G
11
12
21
31
32
33
34
41
42
43
44
51
52
55
56
U
23
7
G
3
17
11
12
32
1
31
21
erreur totale =
31
32
21
5
11
24
34
23,53%
41
31
42
43
44
51
52
55
6
8
56
1
1
1
32
1
32
1
1
3
1
19
6
4
15
2
1
2
1
1
2
27
1
2
1
1
3
4
1
1
8
2
1
7
12
13
13
29
32
2
3
2
1
31
classement des fenêtres test
U
G
11
12
21
31
32
33
34
41
42
43
44
51
52
55
56
33
U
13
1
G
7
6
erreur totale =
11
12
21
29
1
1
26
1
31
32
33
34
40,44%
41
42
43
44
51
52
55
12
16
56
1
31
4
1
13
11
11
19
1
5
1
4
1
31
32
4
2
8
3
6
5
3
2
1
1
12
1
12
11
7
3
1
1
1
2
1
1
1
8
6
2
4
5
1
4
8
11
9
27
16
29
3
2
1
1
1
29
Tableau 1 : Matrices de confusion sur les textures markoviennes.
classement des fenêtres d'apprentissage
U
G
bois
bulle
herbe
laine
sable
canevas
eau
lierre
U
29
7
G
3
25
erreur totale =
bois
bulle
herbe
laine
14
1
32
1
1
26
1
6
23
11
6
4
9
1
1
6
4
classement des fenêtres test
U
G
bois
bulle
herbe
laine
sable
canevas
eau
lierre
U
23
20
G
9
12
bulle
1
9
6
5
1
2
26
5
9
1
1
herbe
laine
19
2
5
1
4
10
15
18
11
10
6
28,75%
canevas
eau
lierre
15
1
3
25
1
erreur totale =
bois
1
sable
sable
2
27
1
18
eau
lierre
48,75%
canevas
24
1
2
4
1
4
1
16
2
4
30
1
Tableau 2 : Matrices de confusion sur les textures naturelles.
14

Documents pareils