(matrice) pseudo

Transcription

(matrice) pseudo
MATRICE PSEUDO-INVERSE (A3)
Ce cas particulier de matrice inverse généralisée est d'usage courant eg dans l'étude du modèle de régression linéaire, du modèle d'analyse de la variance ou du modèle d'analyse de
la covariance.
Nota. On notera par O (et non 0) une matrice nulle. Pour la commodité des notations, le symbole ::: (ou ///) désigne un saut de ligne (ou une suite de sauts de ligne) dans l’écriture matricielle.
(i) Soit A Î Mmn (K) une matrice quelconque.
On appelle (matrice) pseudo-inverse, ou (matrice) p-inverse, ou (matrice) inverse de E.H. MOORE - R. PENROSE, (ou parfois inverse généralisée) de A la matrice, unique, A+ qui vérifie
les quatre conditions suivantes :
A A+ Î Sm (K) (matrice symétrique), A+ A Î Sn (K) (matrice symétrique),
(0)
A A+ A = A,
A+ A A+ = A+.
On note ainsi A+ (ou, souvent aussi, A-) la pseudo-inverse de A et, corrélativement, f + (ou f-) l'application linéaire correspondante. L'ensemble Ps(A) des p-inverses d’une matrice A a donc pour
cardinal 1 : Card Ps(A) = 1.
(ii) On établit les propriétés suivantes :
(01) A+ Î Mnm (K) ;
(02) si A = Omn (matrice nulle de format (m, n)), alors A+ = Onm ;
(03) si A ¹ Omn et rg A = r ¹ 0, alors A admet la factorisation :
(1)
A = B C,
avec B Î Mm r (K), rg B = r, C Î Mr n (K) et rg C = r. Donc, B' B Î Rr (K) et C C' Î Rr (K) (matrice régulière). Par suite, la p-inverse de A est la matrice :
(2)
A+ = C' (C C')-1 (B' B)-1 B' ;
(04) (A')+ = (A+)' ;
(05) (A+)+ = A ;
(06) rg A+ = rg A = r ;
(07) si rg A = r, rg A+ = rg A A+ = rg A+ A = rg A A+ A = rg A+ A A+ ;
(08) a ¹ 0 Þ (a A)+ = a -1 A+ ;
(09) (A' A)+ = A+ (A')+, (A A+)+ = A A+ et (A+ A)+ = A+ A ;
(10) si P Î Om (K) (matrice orthogonale) et Q Î On (K), alors :
(3)
(P A Q)+ = Q' A+ P' ;
(11) si A Î Sn (K), alors A+ Î Sn (K) et A A+ = A+ A ;
(12) si A Î Rn (K), alors A+ = A-1 (matrice inverse ordinaire de A) ;
(13) si A Î Sn (K) Ç In (K) (matrice symétrique et matrice idempotente), alors A+ = A ;
(14) soit A Î Mmn (K). Alors :
(a) rg A = m Þ A+ = A' (A A')-1 et A A+ = Im ;
(b) rg A = n Þ A+ = (A' A)-1 A' et A+ A = In ;
(15) si A Î Mmn (K), alors A A+ Î Sm (K) Ç Im (K), A+ A Î Sn (K) Ç In (K), Im - A A+ Î Sm (K) Ç Im (K) et In - A+ A Î Sn (K) Ç In (K) ;
(16) si B Î Mmr (K), avec rg B = r ¹ 0, et si C Î Rrn (K), avec rg C = r ¹ 0, alors (B C)+ = C+ B+ ;
(17) soit D Î Dn (K) (matrice diagonale) tq rg D = r < n. On établit alors que (à une matrice de permutation près) (décomposition par blocs) :
(4)
D = ((Drr , Or,n-r) ::: (On-r,r , On-r,n-r) ) Þ D+ = ((Drr-1 , Or,n-r) ::: (On-r,r , On-r,n-r)),
avec rg Drr = r, où ::: désigne un saut de ligne ;
(18) soit (Ai)i Î I une suite finie de matrices, supposée être une suite orthogonale (ie Ai Aj' = Om et Ai' Aj = On , " (i, j) Î I2¹). Si l'on pose A = S i Î I Ai , alors A+ = S i Î I Ai+ ;
(19) soit A Î Mmn (K) et R Î Rn (K). Alors, B = A R Þ B B+ = A A+ ;
(20) si A Î Mn (K) et A' A Î Sn (K), alors A+ A = A A+ et (Aj)+ = (A+)j, " j Î N* ;
(21) soit A Î Mmn (K), B Î Mm(1),n (K), C Î Mm(2),n (K) (avec m1 + m2 = m) et A = [B , C] (matrice composée de deux blocs superposés). Si B C' = Om(1),n , alors :
(a) A+ = [B+, C+] ;
(b) A+ A = B+ B + C+ C ;
(c) A A+ = [(B B+ , Om(1),m(2)) ::: (Om(2),m(1) , C C+)] ;
(22) si C = A Ä B (produit de KRONECKER de A et B) (cf produit tensoriel algébrique), alors :
(a) C+ = A+ Ä B+ ;
(b) C+ C = (A+ A) Ä (B+ B) ;
(c) C C+ = (A A+) Ä (B B+) ;
(23) si l'on pose A = [(A11 , A12 ) ::: (A21 , A22)] (matrice comportant 4 blocs), et si A12 = Om(1)n(2) et A21 = Om(2)n(1) , alors (les matrices nulles ayant des formats ad hoc) :
(a) A+ = [(A11+ , O) ::: (O , A22+)] ;
(b) A+ A = [(A11+ A11 , O) ::: (O , A22+ A22)] ;
(c) A A+ = [(A11 A11+ , O) ::: (O , A22 A22+)] ;
(24) si x ¹ O, alors, x Î Kn (considéré comme une matrice colonne) est tq x+ = (x' x)-1 x' = x' / ||x||2 (norme euclidienne, avec K = R) ;
(25) si A = [em ,..., em] Î Mmn (K) (avec em = (1 ,..., 1)' Î Km), alors A+ = (m n)-1 A' ;
(26) A+ = A' ssi A' A Î In (K) ;
(27) soit A Î Mmn (K). Alors Im A = Im (A A+), Im A+ = Im (A+ A), Im (Im - A A+) = (Im A)^ (orthogonal de l’image), Im (In - A+ A) = (Im A')^ , Im (Im - A A +) = Ker A+ (noyau) et Im (In - A + A) =
Ker A, en notant Im M la variété de Kq engendrée par les colonnes de M Î Mpq (K) ;
(28) si l'on partitionne A Î Mmn (K) selon 2 blocs disposés en ligne A = [A11 , A12], avec A11 Î Mm,n-1 (K) et A12 Î Mm1 (K) (identifié à Km), alors (2 blocs disposés en colonne) :
(5)
A+ = [A11+ - A11- A12 B ::: B+],
où B Î Km est défini par :
B = (Im-1 - A11 A11+) A12 si A12 ¹ A11 A11+ A12 ,
(6)
B = k . (A11 A11') A12
sinon,
où k = {1 + A12' (A11 A11')+ A12} / {A12' (A11 A11')+ (A11 A11')+ A12}. Cette propriété sert à construire des algorithmes de calcul de A+ à partir des p-inverses de ses blocs.
(29) si A Î Mmn (K), avec m ³ n, et si B vérifie (A' A)2 B = A' A, alors A+ = (A B)' ;
(30) si A Î Sn (K) et si B vérifie A2 B = A, alors A+ = B' A B ;
(31) si B Î Sm (K), alors B+ = (B X)2 B, où X est solution du système B2 X B2 = B2 ;
(32) soit A Î Mmn (K) (avec rg A = r ¹ 0 et r < min (m,n)) et A11 Î Mr (K). Alors (écriture par blocs 2 x 2) :
(a) A = [(A11 , A12) ::: (A21 , A22)] = [(A11 , A12) ::: (A21 , A21 A11-1 A12)] ;
(b) A+ = [(A11 , A12) ::: (A21 , A22)]
avec A11 = (A11' B A11'), A12 = A11' B A21', A21 = A12' B A11', A22 = A12' B A21', où B = (A11 A11' + A12 A12')-1 A11 (A11' A11 + A21' A21)-1 ;
(33) soit A Î Mmn (K) et X et Y Î Mnm (K). Si X A A' = A' et A' A Y = A', alors A+ = X A Y ;
(34) si A Î Sn (K), rg A = r et Sp A = {l1 ,..., ln} Ì R+*, alors li-1 Î Sp A+, " i Î Nn* ;
(35) soit (Ai)i=1,2 une famille orthogonale de matrices éléments de Mmn (K). Alors :
(a) A1+ A2 = O, A2+ A1 = O, A1 A2+ = O et A2 A1+ = O ;
(b) (A2')+ A1+ = O et (A1')+ A2+ = O ;
(36) si A Î Sn (K) (avec rg A = r) et si B Î Mm-n,m (K) (avec rg B = m - r), alors :
(a) B A = O Þ A + B' B Î Rm (K) ;
(b) A A+ + B+ B Î Im (K) (matrice idempotente) ;
(c) A + B+ B Î Rm (K) et (A + B+ B)-1 = A+ + B+ B ;
(37) soit A Î Mmn (K), B Î Mnp (K), F = A+ A B et G = A F F+. Alors, A B = G F et (G F)+ = F+ G+ ;
(38) soit A Î Mmn (K) une matrice tq rg A = m, A = B C et rg B = rg C = m. Alors, A+ = (B C)+ = C+ B+ ;
(39) si A Î Mn++ (K) (matrice définie positive strictement), alors A+ Î Mn++ (K). Si A Î Mn+ (K) (matrice semi-définie positive), alors A+ Î Mn+ (K) ;
(40) si A Î Mm (K), si P et Q Î Om (K) (matrice orthogonale) et si P A Q = D Î Dm (K) (matrice diagonale), alors A+ = Q D+ P ;
(41) soit A Î Sm (K) (avec rg A = r < m). Alors, il existe B Î Mm,m-r (K) (avec rg B = m - r) tq B' A = 0. Par suite (blocs 2 x 2) :
(a) C = [(A , B) ::: (B' , O)] Î R2m-r (K) ;
(b) A A+ + B (B' B)-1 B' = Im ;
(42) soit A Î Mmn (K) et B Î Mnp (K). Alors : (A B)+ = B+ A+ Û {Im (B B' A') Ì Im A' et Im (A' A B) Ì Im B} ;
(43) " A Î Mmn (R), on a :
(a) A+ = lim a ® 0+ (A' A + a 2 In)-1 A' = lim a ® 0+ A' (A A' + a 2 Im)-1 ;
(b) A+ = S j Î N A' (Im + A A')-j = S j Î N (In + A' A)-j A'.

Documents pareils