Une procédure asymptotique de détection de rupture par des

Transcription

Une procédure asymptotique de détection de rupture par des
Une Procedure asymptotique de détection de
rupture pour des observations à incréments
indépendants.
D.GHORBANZADEH
http ://www.cnam.fr/maths/Membres/ghorbanzadeh/
CNAM
17 juin 2008
Plan
Introduction
Modèle statistique
Modèle de détection
Comportements des observations sous l’hypothèse H0
Statistique du test pénalisée aux bords
Comportements des observations sous l’hypothèse H0
Construction du test
Applications
cas HSU (haemolytic uraemic syndrome)
cas SIDA
Plan
Introduction
Modèle statistique
Modèle de détection
Comportements des observations sous l’hypothèse H0
Statistique du test pénalisée aux bords
Comportements des observations sous l’hypothèse H0
Construction du test
Applications
cas HSU (haemolytic uraemic syndrome)
cas SIDA
Modèle statistique
On considère une suite de variables aléatoires X1 , . . . , Xn avec des
incréments indépendants qui sont susceptibles de changer de loi
après les k premières observations.
Modèle statistique
On considère une suite de variables aléatoires X1 , . . . , Xn avec des
incréments indépendants qui sont susceptibles de changer de loi
après les k premières observations.
avant la rupture
les incréments X1 , . . . , Xk − Xk−1 sont indépendants et suivent une
loi de Poisson P(λ)
Modèle statistique
On considère une suite de variables aléatoires X1 , . . . , Xn avec des
incréments indépendants qui sont susceptibles de changer de loi
après les k premières observations.
avant la rupture
les incréments X1 , . . . , Xk − Xk−1 sont indépendants et suivent une
loi de Poisson P(λ)
après la rupture
les incréments Xk+1 − Xk , . . . , Xn − Xn−1 sont indépendants et
suivent une loi de Poisson P(λ + √δn )
Modèle de détection
On propose le problème de test suivant :
(
H0 :
H1 :
δ=0
δ 6= 0
Statistique du test
Pour tester l’existance le point de rupture, on propose la
statistique du test :
statistique du test
Rn (k) =
Rn (k)
√
n(
Xn − Xk
Xk
−
)
n−k
k
(1)
sous l’hypothèse H0
Xi ∼ P(i λ)
Cov(Xi , Xj ) = min(i, j) λ
sous l’hypothèse H0
Xi ∼ P(i λ)
Cov(Xi , Xj ) = min(i, j) λ
comportement de la statistique du test sous H0
E[Rn (k)] = 0
∀k1 ≤ k2 Cov (Rn (k1 ) , Rn (k2 )) =
Var[Rn (k)] =
λ
k
k
(1 − )
n
n
λ
k2
k1
(1 − )
n
n
Rn (k)
statistique du test pénalisée aux bords
Soit ϕ une fonction continue par morceaux sur [0, 1] satisfaisant :
Z
0
1
ϕ(t)
√
t
2
dt < ∞
statistique du test pénalisée
k
k
?
Rn,ϕ
(k) = ϕ( ) ϕ(1 − ) Rn (k)
n
n
statistique pénalisée
(2)
comportement de la statistique du test pénalisée
∀ k1 ≤ k2
?
?
Cov(Rn,ϕ
(k1 ) , Rn,ϕ
(k2 )) =
ϕ( kn1 ) ϕ(1 − kn1 ) ϕ( kn2 ) ϕ(1 −
k2
k1
(1 − )
n
n

2
 ϕ( kn ) ϕ(1 − kn ) 
?
 λ
Var(Rn,ϕ
(k)) = 
 rk
k 
(1 − )
n
n
k2
n)
λ (3)
fonction de pénalisation
Si l’on prend ϕ(t) = t , l’équation (2) devient :
statistique pénalisée pour la fonction ϕ(t) = t
Kn (k) = n−3/2 (k Xn − n Xk )
équation (2)
(4)
fonction de pénalisation
Si l’on prend ϕ(t) = t , l’équation (2) devient :
statistique pénalisée pour la fonction ϕ(t) = t
Kn (k) = n−3/2 (k Xn − n Xk )
(4)
équation (2)
Définition
Pour tout estimateur consistant λ̂n de λ, soit K?n (k) = √1 Kn (k).
λ̂n
{K?n (t) ;
On définit
t ∈ [0, 1]} comme le processus interpolé
linéaire du processus {K?n (k) ; 1 < k < n}.
comportement de K?n sous l’hypothèse H0
Théorème
sous l’hypothèse H0 , K?n (t) converge au sens de la convergence en
loi des marginales de dimension finie vers le pont Brownien
B(t) = W (t) − t W (1) où {W (t) ; t ∈ [0, 1]} représente le
mouvement Brownien.
Preuve
Par l’équation (3)on a :
∀t1 ≤ t2 cov(Kn (t1 ) , Kn (t2 )) =
[nt1 ]
[nt2 ]
(1 −
)λ
n
n
Or,
lim Cov(K?n (t1 ) , K?n (t2 )) = t1 (1 − t2 )
n→∞
D’autre part, on a : t1 ≤ t2 , Cov(B(t1 ), B(t2 )) = t1 (1 − t2 )
(5)
Proposition
Sous H0 , pour tout η > 0, on a :
lim PH0 ( sup |K?n (t)| ≥ η) = P ( sup |B(t)| ≥ η)
n→∞
t∈[0,1]
t∈[0,1]
(6)
Proposition
Sous H0 , pour tout η > 0, on a :
lim PH0 ( sup |K?n (t)| ≥ η) = P ( sup |B(t)| ≥ η)
n→∞
t∈[0,1]
(6)
t∈[0,1]
Conséquence
Soit τ̂n = Arg sup |K?n (t)| et τ = Arg sup |B(t)|. Alors,
t∈[0,1]
t∈[0,1]
P
τ̂n −→ τ
n→∞
(7)
sous l’hypothèse H1
E[Xi ] =

iλ



si 1 ≤ i ≤ k
δ


 k λ + (i − k) (λ + √ )
n
si k + 1 ≤ i ≤ n
pour tout k1 et k2 ,

 kλ + (min(k , k ) − k)(λ + √δ ) si min(k , k ) ≥ k
1 2
1 2
Cov(Xk1 , Xk2 ) =
n
 min(k , k ) λ
sinon
1 2
comportement de K?n sous l’hypothèse H1
Théorème
sous l’hypothèse H1 , K?n converge au sens de la convergence en loi
des marginales de dimension finie vers le processus process Bτ?
défini :
δ
Bτ? (t) = (t ∧ τ ) (1 − t ∨ τ ) √ + B(t)
(8)
λ
où t ∧ τ = inf{t, τ } et t ∨ τ = sup{t, τ }
Zone de rejet
Nous prenons comme région de rejet : où pour α donné dans [0, 1],
le seuil ηα est déterminé par :
P ( sup |B(t)| ≥ ηα ) = 2
t∈[0,1]
∞
X
(−1)j+1 e −2 j
2
2
ηα
(9)
j=1
Kolmogorov
On note que le test étudié a le même niveau asymptotique que le
test classic de Kolmogorov
Puissance du test
puissance du test
p(τ ) = P ( sup |Bτ? (t)| ≥ ηα )
t∈[0,1]
(10)
Plan
Introduction
Modèle statistique
Modèle de détection
Comportements des observations sous l’hypothèse H0
Statistique du test pénalisée aux bords
Comportements des observations sous l’hypothèse H0
Construction du test
Applications
cas HSU (haemolytic uraemic syndrome)
cas SIDA
HSU (haemolytic uraemic syndrome)
Les données représentent le nombre de ’HUS’ à Birmingham et
Newcastle de 1970 à 1989.
référence
R. W. West & R. T. Ogden. (1997). Continuous-time estimation
of a change-point in a Poisson process. Journ. Statist. Comput.
Simul. 56, pp 293-302.
HSU (Birmingham)
graphe de |K?n (k)| pour les données de Birmingham .
estimation (Birmingham)
xn
λ̂n =
= 5.65
n
le maximum est atteint au point : k = 11, ce qui correspond à la
valeur de statistique : |K?n (11)| = 4.15.
Pour α = 5%, la valeur critique ηα = 1.36, on rejette donc
l’hypothèse reject H0 .
δ = |Kn (11)| = 9.87, ce qui donne une puissance ègale à 41%.
HSU (Newcastle)
graphe de |K?n (k)| pour les données de Newcastle .
estimation (Newcastle)
xn
λ̂n =
= 5.
n
le maximum est atteint au point : k = 15, ce qui correspond à la
valeur de statistique : |K?n (11)| = 1.6994.
Pour α = 5%, la valeur critique ηα = 1.36, on rejette donc
l’hypothèse reject H0 .
δ = |Kn (15)| = 8.50, ce qui donne une puissance ègale à 21%.
SIDA (cuba)
Les données représentent le nombre de ’SIDA’ au Cuba de 1986 à
1992.
référence
The HIV-AIDS Epidemic in Cuba. Internal Report. Departamento
de Epidemiologia, Sanatorio Santiago de Las Vegas. Cuba 1999.
SIDA (cuba)
graphe de |K?n (k)| pour les données SIDA au Cuba .
estimation (SIDA)
λ̂n = xnn = 32.15
le maximum est atteint au point : k = 12, ce qui correspond à la
valeur de statistique : |K?n (11)| = 9.61.
Pour α = 5%, la valeur critique ηα = 1.36, on rejette donc
l’hypothèse reject H0 .
δ = |Kn (15)| = 54.49, ce qui donne une puissance ègale à 98%.