Reconnaissance de loi via une estimation de densités par
Transcription
Reconnaissance de loi via une estimation de densités par
Reconnaissance de loi via une estimation de densités par histogramme pour la modélisation de canaux de transmission. Guilhem C OQ1 , Olivier A LATA2 , Christian O LIVIER2 , Xiang L I2 , Yannis P OUSSET2 1 Laboratoire de Mathématiques et Applications, UMR CNRS 6086 Téléport 2, BP 30179, 86962 Futuroscope Chasseneuil cedex 2 Laboratoire Signal, Image et Communications, UMR CNRS 6172 Téléport 2, BP 30179, 86962 Futuroscope Chasseneuil cedex [email protected], [email protected] olivier,li,[email protected] Thème – Représentation des signaux et images. Application aux communications numériques. Problème traité – Reconnaissance de la loi d’un échantillon parmi une famille de lois données. Originalité – Les critères d’information sont utilisés pour déterminer, à partir d’un échantillon, un histogramme estimant la loi inconnue, ici, celle modélisant un canal de propagation radioélectrique. Cet histogramme permet de calculer des distances de type Kullback-Leibler entre densités de probabilités ; ces distances sont ensuite utilisées pour la reconnaissance de la loi. Cette méthode diffère de l’approche de type Kolmogorov-Smirnov utilisée habituellement dans ce contexte applicatif, cette dernière utilisant des distances sur les fonctions de répartition empiriques. Ces fonctions, qui conservent toute l’information donnée par l’échantillon, sont beaucoup plus difficile à manipuler que l’histogramme choisi par critères d’information, qui peut être vu comme un résumé de cette information à un nombre très restreint de classes. Résultats – Les perfomances de l’outil de reconnaissance de loi par histogramme sont comparées à celles de l’outil classique de KomogorovSmirnov par une étude statistique appliquée aux radiocommunications, cette étude portant sur les taux de reconnaissance, valeur prédictive positive et précision des tests. Il en ressort que notre méthode donne une meilleure reconnaissance des modèles des canaux radioélectriques. 1 Estimation de densité par histogramme Soit x = xn = x1 , . . . , xn un n-échantillon d’une densité de probabilité inconnue f dont le support est un intervalle I ⊂ R. Soit également P = (Ij )j∈[[1,m]] une partition de I en m intervalles. On sait que l’estimée au sens du maximum de vraisemblance de f par une fonction constante par morceaux sur P est donnée par l’histogramme : hP = m X nj n`j j=1 Ij (1) où `j est la longueur de l’intervalle Ij et nj le nombre d’échantillons contenus dans Ij . Le choix de la partition P sur laquelle est construit cet histogramme est crucial lors d’une telle estimation. Il s’agit d’un problème de sélection de modèle non-paramétrique que nous nous proposons de résoudre à l’aide d’un critère d’information. Nous appuyant sur les travaux de Rissanen et al. [5, 6, 1], nous avons proposé dans [3, 2] un critère reposant sur la théorie de l’information. Chaque partition P de I est utilisée pour encoder les données x. La longueur d’un tel codage est estimée par le critèEn vue de synthétiser les résultats sur la figure 1, nous moyennons ces taux de reconnaissance sur les trois lois génératrices utilisées. re CRIT(x, P ) = − m X j=1 nj log nj log n + (m − 1) . n`j 2 (2) Le principe du Minimum Description Length [1] nous pousse alors à choisir la partition Pb qui minimise ce critère et à estimer f par hPb comme en (1). L’intervalle I est découpé en R ∈ N intervalles de longueurs égales r. Nous nous limitons aux partitions de I dont les bornes des intervalles coïncident avec ce découpage. Un algorithme de programmation dynamique détaillé en annexe A de [2] permet de minimiser (2) sur les 2R−1 partitions en question en un nombre d’opérations de l’ordre de seulement R2 . La partition obtenue, dénommée dynamique, présente des intervalles de longueurs variables. 2 Reconnaissance de loi par histogramme 2.1 Position du problème Donnons nous une famille de densité de probabilités paramétrées. Dans ce travail nous considérons la famille constituée des lois de Rayleigh, Nakagami et Weibull : ¶ µ x x2 Rayleigh : fR,σ (x) = 2 exp − 2 x≥0 σ 2σ µ ¶ µx2 2µµ x2µ−1 (3) exp − Nakagami : fN,µ,Ω (x) = x≥0 (µ − 1)!Ωµ Ω µ k¶ x kxk−1 exp − k Weibull : fW,k,λ (x) = x≥0 k λ λ où σ, µ, Ω, k, λ sont les paramètres de forme de ces lois. Notons que, pour µ = 1 ou k = 2, les loi de Nakagami ou Weibull correspondent à celle de Rayleigh. Ces lois sont classiquement utilisées pour la modélisation des canaux de propagation radio. Nous nous intéresserons aux cas où les émetteurs et récepteurs sont en position de visibilité (Line Of Sight, LOS) ou de non-visibilité (Non Line Of Sight, NLOS), voir [7, 8]. Le cas NLOS est le plus délicat. En effet, une simulation de la propagation des ondes radio en configuration NLOS par un logiciel mis au point par le laboratoire XLIM-SIC [4] montre que les densités candidates (3) sont plus proches visuellement que dans la configuration LOS. Nous nous proposons, à partir d’un échantillon xn d’une loi inconnue de ce type, de déterminer si cette loi est du type Rayleigh, Weibull, ou Nakagami. 2.2 Les différentes méthodes étudiées Nous utilisons deux procédures de reconnaissance pour définir les lois en compétition. La procédure à modèle : les paramètres de forme σ, µ, Ω, k, λ dans (3) sont fixés a priori ; fR,σ , fN,µ,Ω et fW,k,λ deviennent les lois en compétition. On peut considérer que ces lois ont été déterminées au préalable par apprentissage. b sont estimés par les méthodes du maximum de vraisemblance ou b b La procédure aveugle : les paramètres de forme σ b, µ b, Ω, k, λ des moments, à partir de l’échantillon. Les densités fR,bσ , fN,bµ,Ω b et fW,b b sont les lois en compétition. k,λ La reconnaissance s’effectue alors par les deux méthodes suivantes : La méthode de Kolmogorov-Smirnov (KS) : c’est celle classiquement utilisée. La distance de Kolmogorov-Smirnov entre deux fonctions de répartition F et G est définie par KS(F, G) = supt∈I |F (t) − G(t)|. Notons Fb la fonction de répartition empirique de l’échantillon. La loi est choisie par minimisation de la distance KS entre Fb et les fonctions de répartition des lois en compétition. La méthode à histogrammes (KL) : elleR utilise la distance de Kullback-Leibler (KL) symétrisée qui est définie entre deux densités de probabilités f et g par KL(f, g) = 21 (f − g) log(f /g)dλ. Nous notons hPb l’histogramme dynamique choisi par minimisation du critère (2). La loi est choisie par minimisation de la distance KL entre hPb et les densités des lois en compétition. Finalement, nous considérons quatre stratégie de reconnaissance : KS à modèle, KS aveugle, KL à modèle, KL aveugle. 3 Présentation des résultats Nous travaillons dans un cadre théorique visant à valider les méthodes à histogramme KL et à les comparer avec les méthodes usuelles KS. Nous envisageons deux cas. Le cas LOS, où les lois génératrices sont relativement éloignées visuellement, et le cas NLOS où ces lois sont plus proches. Pour chacun de ces cas et pour n variant de 100 à 1000, nous générons 900 n-échantillons de chaque loi. Nous appliquons à chacun de ces échantillons les quatre stratégies de reconnaissance étudiées. A titre d’exemple et pour synthétiser les résultats, nous montrons en figure 1 le taux de reconnaissance moyen (Average True Positive rate) des trois lois génératrices , ie la proportion d’échantillons dont la loi a été bien reconnue par la méthode. La méthode à histogramme KL est globalement plus efficace que la méthode classique KS, surtout dans le cas le plus difficile de notre étude : cas NLOS et procédure aveugle. De plus, cette méthode est plus rapide en temps de calcul (d’un facteur de l’ordre de 10). Nous présenterons une étude statistique plus poussée de ces résultats de simulation, notamment en termes de matrices de confusion, valeur prédictive positive et de précision des tests, pour confirmer que la méthode à histogramme amène une amélioration significative des résultats. procédure à modèle, cas LOS procédure aveugle, cas LOS procédure à modèle, cas NLOS procédure aveugle, cas NLOS F IG . 1 – Comparaison des taux de reconnaissance moyen (Average True Positive rate) sur les trois lois génératrices en fonction de n selon les méthodes utilisées et les cas envisagés (LOS : densités assez distinctes, NLOS : densités plus proches). Références [1] A. Barron, J. Rissanen, and B. Yu. The minimum description length principle in coding and modeling. IEEE Trans. Inform. Theory, 44(6) :2743–2760, 1998. [2] G. Coq. Utilisation d’approches probabilistes basées sur les critères entropiques pour la recherche d’information sur support multimédia. Thèse de doctorat, Université de Poitiers, France, Décembre 2008. [3] G. Coq, C. Olivier, O. Alata, and M. Arnaudon. Information criteria and arithmetic codings : an illustration on raw image. In 15th European Signal Processing Conference proceedings, pages 634–638, Poznan, Poland, 2007. [4] F. Escarieu, Y. Pousset, R. Vauzelle, and L. Aveneau. Outdoor and indoor channel characterization by a 3d simulation software. Septembre 2001. PIMRC ’2001, San diego, USA. [5] J. Rissanen. Stochastic complexity and modeling. Ann. Statist., 14(3) :1080–1100, 1986. [6] J. Rissanen, T. P. Speed, and B. Yu. Density estimation by stochastic complexity. IEEE Transactions on Information Theory, 38(2) :315–323, 1992. [7] N. C. Sagias and G. K. Karagiannidis. Gaussian class multivariate Weibull distributions : Theory and applications in fading channels. IEEE Transactions on Information Theory, 51(10) :3608–3619, Oct 2005. [8] T.K. Sarkar, Zhong Ji, Kyungjung Kim, A. Medouri, and M. Salazar-Palma. A survey of various propagation models for mobile communication. Antennas and Propagation Magazine, IEEE, 45(3) :51–82, 2003.