art n°5 2013 Vol 1 pp 37-43 Etude des performances

Transcription

art n°5 2013 Vol 1 pp 37-43 Etude des performances
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
Etude des performances de l’Analyse factorielle de données
dans l’indexation d’images couleurs fixes
Ramafiarisona H.M.1, Randriamitantsoa A. A.2, Rakotondraina T.E.3
Laboratoire de Télécommunication, d'Automatique, de Signal et d'Images
(T.A.S.I.)
Département Télécommunication – Ecole Supérieure Polytechnique d’Antananarivo
Université d’Antananarivo
BP 1500, Ankatso – Antananarivo 101 – Madagascar
1
[email protected], [email protected], [email protected]
Résumé
Abstract
Dans cet article, nous présentons un nouveau
In this paper, we present a new indexing scheme
schéma d’indexation d’images couleurs qui utilise
for color images using factor analysis as data
l’analyse de données comme transformation.
processing. The main objective is to achieve a
L’objectif principal est de réaliser une extraction
signature extraction of the image as efficiently as
de signature de l’image aussi efficace que possible
possible with minimal distortion. That is why we
avec le minimum de distorsion. C’est pourquoi,
turn to the index method of image transform which
nous tournons vers la l’indexation par transformée
transforms the field of image pixels into other
qui transforme le domaine des pixels de l’image
areas.
vers d’autres domaines. L’idée de base est de
The basic idea is to decorrelate pixels and
décorréler les pixels et de compacter l’énergie sur
compacting energy on a few components and / or
peu de composantes et/ou v.s qui rendent plus
singular values that make more efficient extraction
efficace l’extraction des attributs dans le domaine
of attributes in the transformed domain. Processing
des transformés. La transformation optimale est
problems is that pixels completely decorrelated in
celle qui décorrèle complètement les pixels dans le
the
domaine transformé. De telle transformation est
transformed
domain.
Such
optimal
transformation is known as factor analysis that is
sous le nom d’analyse factorielle qui est utilisé
used in this article.
dans cet article. La performance de la méthode a
été évaluée suivant les courbes de rappel/précision
The performance of the method was evaluated
malgré les inconvénients de cette transformation.
following the curves of recall / precision despite
the drawbacks of this transformation
Mots-clés :
indexation,
ACP,
SVD,
images
couleurs.
Keywords: color images, indexation, ACP, SVD.
37
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
G, B en cherchant les trois composantes
1. Introduction
Malgré
les
performances
des
principales correspondantes.
méthodes
•
d’indexation dans le domaine spatial utilisant les
Approche
marginale :
elle
consiste
à
moments ou les histogrammes, elles ne sont pas
décorréler les lignes ou colonnes d’une
meilleures car, entre autres, elles ne permettent pas
composante couleur.
de reconstituer les attributs de l’image elles même
2.2 La décomposition en Valeurs singulières
et elles ne sont pas invariants aux changements
Il s’agit de dissocier la taille de l’image originale
géométriques. C’est pourquoi, nous essayons dans
par trois : Rouge, Vert, Bleu en ne conservant
cet article de remédier à ces inconvénients en
qu’un seul canal qui range le maximum d’énergie
utilisant l’analyse factorielle de données dans une
de l’image dans les valeurs singulières
méthode d’indexation comme une transformation
optimale. Il s’agit alors de résoudre le problème
3. La décomposition par A.C.P
suivant:
3.1
En utilisant L’A.C.P/SVD comme transformation
D’une manière générale [1][2][3], pour un vecteur
au lieu de d’un histogramme dans une chaine de
aléatoire
compression, peut-on améliorer les performances
composantes par :
Formulation mathématique
X
de
dimension
n,
notons
ses
de l’extraction de signatures en vue d’une bonne
recherche
d’images?
Une
décorrélation
= ⋮
et
compactage d’énergie maximum avec A.C.P/SVD
permettent-ils d’effectuer une extraction efficace?
Sa moyenne est définie par :
2. Méthodologie
La modélisation d’une image par
(01)
l’analyse
= ⋮
factorielle de données. vise à décomposer l’image
dans un espace de représentation de dimension
(nombre de vecteur-variable) où pour l’ACP, ses
(02)
composantes appelées composantes principales
Où E ( X j ) est l'espérance mathématique de X j pour
(C.P) ; respectivement, les valeurs singulières
variant de 0 à − 1.
(V.S) pour la SVD, seront totalement décorrélées.
Sa matrice de covariance s’écrit :
2.1
L’analyse en composantes principales
•
Approche vectorielle : elle consiste à
décorréler les trois composantes couleurs R,
38
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
 σ 00 σ 01 L σ 0, n−1 


σ 10 σ 11 L σ 1, n−1 

ΓX = 
M
M 


σ

σ
L
σ
n −1,n −1 
 n−1,0 n−1,1
peut être approximé par Z et vérifiant les relations
suivantes :
(03)
X − U m Z est minimum au sens de l’erreur
(i)
quadratique moyenne [5] [6]. Cette propriété fait
où σ ij = E (( X i − mi )( X j − m j )), 0 ≤ i, j ≤ n − 1
que
la
transformation
maximum
compacte
au
un
minimum
de
sur
composantes principales.
Comme la matrice est semi-définie positive,
Les composantes de sont totalement
(ii)
alors ses valeurs propres sont réels positifs ou nuls
décorrélées et on a :
et il existe une matrice orthogonale Q telle que :
 σ 02


 t
ΓX = Q  0 O
Q
 0 σ2 
n −1 

l’énergie
A.C.P
∀i ≠ j σ i j = 0
(06)
(04)
3.2 Les valeurs singulières
où Q ∈ R nxn
Nous considérons un système linéaire ayant pour
(ii) les vecteurs colonnes q0 , q1 , L , qn −1 deQ forment une base
Toute matriceA, de taille m× n, de rang peut
matrice carrée A de dimension n et de rangk.
(i) σ 02 ≥ σ 12 ≥ L ≥ σ n2−1 ≥ 0 sont les valeurs propres de Γ X
orthonormale de R n , composee de vecteurs propres de Γ X
être décomposée [7] [8] en somme pondérée de
Et en supposant désormais que X est centrée et
matrices unitaires m× n par SVD (Singular Value
réduite, nous avons [4] :
 Z0 
 X0 




Z1 
X1 
t
t 

Z=
= U m.X = U m
 M 
 M 




 Z m−1 
 X n −1 
Decomposition).
Les valeurs singulières de la matrice A de rang ,
(05)
notée σ Asont les racines carrées non nulles des
valeurs propres de et .
Soit :
où les vecteurs colonnes u0 , u1 ,L, um−1 deU m forment unebase
orthonormale de R m , composee de mvecteurs propres de Γ X
= [. ] = [ ]
(07)
associés aux m premieres valeurs propres.
Avec :
Ainsi, tout vecteur aléatoire de dimension peut être décomposé dans les sous espaces propres
est la ième valeur propre du produit matriciel
associés aux valeurs propres de ΓX. Par suite, en vertu des propriétés de la transformation A.C.P, X
est la ième valeur singulière de la matrice.
39
ou .
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
-
Elles sont réelles, positives ou nulles et sont
3.4 Schémas d’indexation proposés
classées par ordre de grandeur croissante [9] [10]
3.4.1 Schéma d’indexation par ACP
[11]:
ଵ ≫ ଶ ≫ ⋯ ≫ ௞ ௞ାଵ ௡ 0
-
(08)
La plus grande valeur singulière, appelée
A et
aussi norme spectrale, est notée σ
représente une norme induite sur l'espace
des matrices de même dimension queA.
-
La
plus
petite
valeur
singulière
est
notéeσA [12] [13].
Figure 1.01 : Architecture du SRIC avec ACP
3.3 Application de l’A.C.P/ SVD en indexation
3.4.2 Schéma d’indexation par SVD
d’images
3.3.1 Algorithme d’indexation par ACP
-
Prendre une image
-
Décomposition de
l’image en blocs
RVB
-
Calcul
des
trois
premières
composantes principales de l’image
par ACP
-
Stocker les signatures de l’image
dans une base d’index
Figure 1.02 : Architecture du SRIC utilisant
ACP
3.3.2 Algorithme d’indexation par SVD
-
Prendre une image
-
Décomposition de
4. Résultats de la simulation et discussions
La qualité d'un système doit être mesurée en
comparant les réponses du système avec les
l’image en blocs
RVB
-
réponses idéales que l'utilisateur espère recevoir.
Décomposition par SVD de chacun des
Pendant la simulation et le programme calculant
blocs
-
Obtention de valeurs singulières
les index de l’image par la méthode ACP, on a
-
Stocker les signatures de l’image
obtenu les résultats suivants pour une image
dans une base d’index
« beach.jpg » pendant l’extraction des signatures :
40
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
4
3
La figure 1.05 montre cette reconstitution de
Index de l'image 'space.jpg' par ACP
x 10
l’index de l’image.
2.5
Recontitution de l'i ndex pour k=50
600
1.5
500
V a le u r d e s v e c te u r s p ro p re s
Valeurs des C.P
2
1
0.5
0
0
400
300
200
100
50
100
150
200
Valeur des pixels des index
250
300
0
0
50
100
150
Valeur des bins
200
250
300
Figure 1.03 : Extraction d’index par ACP en
Figure 1.05 : Recontruction
fonction des C.P
Cette figure reflète la méthode d’extraction des
de
l’index
de
l’image pour k=50
informations de l’image par son contenu couleur
avec ACP. Les nouvelles signatures de l’image
Variation de valeurs de couleurs dans la C.P,k=50
1000
Valeur des vecteurs propres
sont les composantes principales.
Extraction des index par ACP
12000
10000
800
600
400
200
Valeurs des C.P
0
8000
0
100
200
300
Valeur des bins pour le canal R
6000
4000
Figure 1.06 : Variation de couleurs pour le
2000
0
canal R avec k=50
0
5
10
15
20
25
30
Valeurs de RGB de l'index
35
40
45
De même avec la méthode SVD, les signatures de
l’image
Figure 1.04 : Illustration des index de l’ACP
sont
obtenues
par
suite
de
la
décomposition en valeurs singulières de l’image.
dans les canaux RVB d’une image
Elles sont rangées par ordre décroissante dans la
On est dans le domaine de transformés comme
matrice.
méthode d’indexation, les attributs, ici, doc sont
Les résultats issus de la méthode avec SVD
réversibles ; pour un certain rang de valeurs
donnent :
propres ; on peut reconstituer l’image.
41
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
Variation de V.S suivant k sans B
Index de l'image 'glagow.jpg' par SVD
15
900
800
600
Valeur des V.S
Valeurs singulières
700
10
5
500
400
300
200
100
0
0
10
20
30
40
50
60
Valeurs de k
70
80
90
0
100
0
50
100
150
200
Valeur des pixels des index
250
300
Figure 1.10 : Représentation de l’index de
Figure 1.07 : Valeur des suivant k pour B
l’image
Variation de V.S suivant k dans R
70
Interprétations :
60
Pour k de valeurs minimum, les σ atteignent le
Valeurs singulières
50
maximum. Ces valeurs diminuent au fur et à
40
mesure que k augmente.
30
Les σ sont décroissantes et à partir d’un certain
20
rang, les v.s sont nulles. Ceci est expliqué par le
10
fait que l’image est presque reconstruite pour cette
0
0
10
20
30
40
50
60
Valeurs de k
70
80
90
100
valeur k.
Les σ de l’image concernée varient d’une image à
Figure 1.08 : Valeur des suivant k pour R
une autre selon la couleur dominante. Par exemple,
Variation de V.S suivant k dans V
25
pour une image de fruit dont la couleur rouge est
dominante. Le nombre de σ atteint le maximum
Valeurs singulières
20
par rapport aux autres canaux de couleur V et B.
15
Propriétés fondamentales :
10
•
5
Une image est dite reconstruite si ses
valeurs singulières tendent vers 0 (pour k
0
0
10
20
30
40
50
60
Valeurs de k
70
80
90
élevé).
100
•
Figure 1.09 : Valeur des suivant k dans V
Une image est dite est floue si ses valeurs
singulières atteignent leurs maximum. (pour
k de valeur faible).
42
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
d'une
5. Conclusion
Composantes
L’utilisation d’une transformation optimale au sens
effectivement
d’améliorer,
couleur:
Analyse
Principales»,
en
Master
ENST Bretagne, 2000.
de la décorrélation et compactage d’énergie
permettent
image
voire
[3]
optimiser les techniques d’indexation.
S.
Peter,
Theory»,
« Algorithmic
Mathematics
Information
of
Digital
Information Processing, Springer 2006.
Cependant, une transformation optimale telle
qu’A.C.P.et/ou SVD ne possède pas un algorithme
[4]
R. Raveaux, « Cours de Statistiques
rapide comme avec l’histogramme et les méthodes
Analyse en Composantes Principales »,
de moments.
Université de La Rochelle, octobre 2008.
Ce qui ne rend pas pratique cette méthode par
[5]
D. Vincent, « Analyse en composante
rapport à l’utilisation des techniques dans le
principale pour une métrique donnée »,
domaine de luminance.
Pré-master d'informatique fondamental,
Ecole Normale Supérieure de Lyon,
Du point de vue performance, en faisant un bon
2008.
choix des paramètres d’indexation tels que :
[6]
G.
Wisniewski,
«
Analyses
en
-
taille de bloc,
-
nombre de C.P utilisées
Composantes Principales », Paris VII,
-
nombre de V.S à garder, ou encore
2009.
-
nombre de niveau de quantification,
[7]
H.B.
Razafindradina,
P.A.
Les méthodes d’analyse factorielle de données tels
Randriamitantsoa, « Tatouage robuste et
l’ A.C.P et la SVD peuvent réaliser une meilleure
aveugle dans le domaine des valeurs
recherche d’image par le contenu par rapport aux
singulières », Laboratoire LASM, page
autres méthodes classiques avec une qualité
5-7, janvier 2010.
d’image reconstruite similaire.
[8]
A. Favre, « Decomposition en valeurs
singulières et analyse de contenu »,
Visiosoft S.A and L.O: Pochon, IRDP,
6. References
2000.
[1]
A. Bovik, « Handbook of Image and
[9]
video processing », Academic press,
N. Le Bihan, J. Mars, « Singular Value
decomposition of quaternion matrices: a new
2000.
tool for vector sensor signal processing »,
[2]
J. Budin, C. Xavier, « Décomposition
Signal processing, 1984.
43
MADA-ETI, ISSN 2220-0673, Vol.1, 2013, www.madarevues.gov.mg
[10]
A. Matthew, Tuck, P. A. Pentland,
« Face recognition using eigenface
method », IEEE Conference on computer
vision and pattern recognition, pp 586591, 1991.
[11]
L. Cao, « Singular Value Decomposition
applied to digital image processing »,
Division of computing studies, Arizona
State University polytechnic Congres
Mesa, Arizona 85212.
[12]
G. Zeng, « Face recognition with
singular value decomposition », CISSE
proceeding, 2000.
[13]
Rui, Huang, Chang, « Image retrieval:
Current techniques, processing direction
and open issues», Journal of visual
Communication and Image
Representation, p 10: 1-23.
44