Quantification vectorielle sous condition de marge

Transcription

Quantification vectorielle sous condition de marge
Quantication vectorielle sous condition de marge
C.Levrard
Université Paris 11 and UPMC
INRIA Projet Select
11ème Colloque Jeunes Probabilistes et Statisticiens
11 avril 2014
Introduction
Principe
Quantication
Introduction
Quantication
Principe
P une distribution sur H, dim(H) = d ≤ +∞
séparer H selon
k zones
de manière pas totalement stupide
en n'ayant accès qu'à un n-échantillon
Quantication par Voronoï
Quanticateur et risque
Quanticateur vs dictionnaire
P une distribution sur H, et Q un k -quanticateur
R (Q ) = P kx − Q (x )k2
Quantication par Voronoï
Quanticateur vs dictionnaire
Quanticateur et risque
Quantication par Voronoï
Quanticateur vs dictionnaire
Quanticateur et risque
Quantication par Voronoï
Quanticateur et risque
Quanticateur vs dictionnaire
P une distribution sur H, et Q un k -quanticateur
R (Q ) = P kx − Q (x )k2
c = (c1 , . . . , ck ) dictionnaire
ci mot
Quantication par Voronoï
Quanticateur et risque
Quanticateur vs dictionnaire
P une distribution sur H, et Q un k -quanticateur
Risk/Distortion R (c) = E(mini =1,...,k kX − ci k2 ) = P γ(c, .)
c = (c1 , . . . , ck ) dictionnaire
ci mot
Fonction de contraste
( d k
(R )
γ:
(c
×
,
Rd
x)
−→
7−→
R
min kci − x k2
i =1,...,k
Quantication par Voronoï
Stratégie de l'ERM
Stratégie ERM
X1 , . . . , Xn un n-échantillon.
On veut : c∗ = arg min P γ(c, .)
On a : n1
Pn
2
i =1 minj =1,...,k kXi − cj k = Pn γ(c, .)
→ ĉn ∈ arg min Pn γ(c, .)
Quantication par Voronoï
Stratégie de l'ERM
Stratégie ERM
X1 , . . . , Xn un n-échantillon.
On veut : c∗ = arg min P γ(c, .)
On a : n1
Pn
2
i =1 minj =1,...,k kXi − cj k = Pn γ(c, .)
→ ĉn ∈ arg min Pn γ(c, .)
Ce qu'on veut majorer/minorer
(def)
`(ĉn , c∗ ) =
R (ĉn ) − R (c∗ ) or /and
E`(ĉn , c∗ )
Vitesses faibles
Vitesses faibles
Linder 94
On suppose que Supp(P ) ⊂ B(0, 1). Alors
√
∗
kd
n
E`(ĉn , c ) . √ .
Vitesses faibles
Vitesses faibles
Biau, Devroye, Lugosi 2008
On suppose que Supp(P ) ⊂ B(0, 1). Alors
k
n
E`(ĉn , c∗ ) . √ .
Vitesses faibles
Vitesses faibles
Biau, Devroye, Lugosi 2008
On suppose que Supp(P ) ⊂ B(0, 1). Alors
k
n
E`(ĉn , c∗ ) . √ .
Vitesse minimax (Bartlett, Linder and Lugosi 1998)
Soit P l'ensemble des distributions à support inclus dans B(0, 1).
Quels que soient k , d et n ≥ a0 k ,
sup E`(ĉn , c ) & k
P ∈P
∗
r
k 1−4/d
.
n
Vitesses rapides
Condition de marge
Condition de marge
N ∗ squelette de Voronoï
N ∗ (ε) = {x |d (x , N ∗ ) ≤ ε} ε-voisinage
p(ε) = P(N ∗ (ε))
Vitesses rapides
Condition de marge
Condition de marge
Vitesses rapides
Condition de marge
Condition de marge
N ∗ squelette de Voronoï
N ∗ (ε) = {x |d (x , N ∗ ) ≤ ε} ε-voisinage
p(ε) = P(N ∗ (ε))
Condition de marge
Supp(P ) ⊂ B(0, 1), et
∃r0
où
x ≤ r0
⇒
p(x ) ≤ ax ,
a est déterminé en fonction de P et k .
Vitesses rapides
Condition de marge
Condition de marge
Condition de marge
Supp(P ) ⊂ B(0, 1), et
∃r0
où
x ≤ r0
⇒
p(x ) ≤ ax ,
a est déterminé en fonction de P et k .
Exemple :
Gap : p (x ) = 0 if
x ≤r
Vitesses rapides
Condition de marge
Condition de marge
Condition de marge
Supp(P ) ⊂ B(0, 1), et
∃r0
où
x ≤ r0
⇒
p(x ) ≤ ax ,
a est déterminé en fonction de P et k .
Exemple :
Mélange gaussien ou presque :
pmin
pmax
>
512k σ 2
2k 2
−B̃ 2 /32σ 2
,
∨
e
2
2
2
(1 − )B̃ 2 (1 − e −B̃ /128σ ) (1 − )σ
Vitesses rapides
Degré de séparation
Degré de séparation
Vitesses rapides
Degré de séparation
Degré de séparation
−→ δ écart de risque entre minimiseurs locaux seulement et
minimiseurs globaux
Vitesses rapides
Convergences rapides
Vitesse dimensionnée
L.2012
Si Supp(P ) ⊂ B(0, 1),
P est δ-séparée et satisfait une CM, alors
∗
E`(ĉn , c
−→ κ0 (P ) = 4k
1
δ
∨p
R (c∗ )
1
) . κ0 (P )
+O
n
n2
64
2 2
min B r0
Vitesses rapides
Convergences rapides
Vitesse adimensionnée
L.2013
Si Supp(P ) ⊂ B(0, 1),
P est δ-séparée et satisfait une CM, alors
E`(ĉn , c∗ ) . κ0 (P )
C (P )
2
n3
Une perspective : quantication et sélection de variable
Procédure type Lasso
Quantication et sélection de variable selon
ĉn,λ ∈ arg min Pn γ(c, .) + λn kck1
Une perspective : quantication et sélection de variable
Procédure type Lasso
Quantication et sélection de variable selon
ĉn,λ ∈ arg min Pn γ(c, .) + λn kck1
Résultats verts
6k
−→ Si λ ≥ √
n , alors
E`(ĉn,λ , c∗ ) ≤ inf (`(cR , c∗ ) + 2λR ) +
R >0
2λ
k
c
0
+√
n
Une perspective : quantication et sélection de variable
Procédure type Lasso
Quantication et sélection de variable selon
ĉn,λ ∈ arg min Pn γ(c, .) + λn kck1
Résultats verts
−→ Si
P satisfait une CM, et λ &
grand,
√
k√
log(kd )
n , alors, pour
kĉn,λ − c∗n k1 ≤
avec
C (√k , d )
,
n
c∗n ∈ arg min `(c, c∗ ) + c0 λ2 kck0 .
n assez
Une perspective : quantication et sélection de variable
Merci de votre attention