Une procédure asymptotique de détection de rupture par des
Transcription
Une procédure asymptotique de détection de rupture par des
Une Procedure asymptotique de détection de rupture pour des observations à incréments indépendants. D.GHORBANZADEH http ://www.cnam.fr/maths/Membres/ghorbanzadeh/ CNAM 17 juin 2008 Plan Introduction Modèle statistique Modèle de détection Comportements des observations sous l’hypothèse H0 Statistique du test pénalisée aux bords Comportements des observations sous l’hypothèse H0 Construction du test Applications cas HSU (haemolytic uraemic syndrome) cas SIDA Plan Introduction Modèle statistique Modèle de détection Comportements des observations sous l’hypothèse H0 Statistique du test pénalisée aux bords Comportements des observations sous l’hypothèse H0 Construction du test Applications cas HSU (haemolytic uraemic syndrome) cas SIDA Modèle statistique On considère une suite de variables aléatoires X1 , . . . , Xn avec des incréments indépendants qui sont susceptibles de changer de loi après les k premières observations. Modèle statistique On considère une suite de variables aléatoires X1 , . . . , Xn avec des incréments indépendants qui sont susceptibles de changer de loi après les k premières observations. avant la rupture les incréments X1 , . . . , Xk − Xk−1 sont indépendants et suivent une loi de Poisson P(λ) Modèle statistique On considère une suite de variables aléatoires X1 , . . . , Xn avec des incréments indépendants qui sont susceptibles de changer de loi après les k premières observations. avant la rupture les incréments X1 , . . . , Xk − Xk−1 sont indépendants et suivent une loi de Poisson P(λ) après la rupture les incréments Xk+1 − Xk , . . . , Xn − Xn−1 sont indépendants et suivent une loi de Poisson P(λ + √δn ) Modèle de détection On propose le problème de test suivant : ( H0 : H1 : δ=0 δ 6= 0 Statistique du test Pour tester l’existance le point de rupture, on propose la statistique du test : statistique du test Rn (k) = Rn (k) √ n( Xn − Xk Xk − ) n−k k (1) sous l’hypothèse H0 Xi ∼ P(i λ) Cov(Xi , Xj ) = min(i, j) λ sous l’hypothèse H0 Xi ∼ P(i λ) Cov(Xi , Xj ) = min(i, j) λ comportement de la statistique du test sous H0 E[Rn (k)] = 0 ∀k1 ≤ k2 Cov (Rn (k1 ) , Rn (k2 )) = Var[Rn (k)] = λ k k (1 − ) n n λ k2 k1 (1 − ) n n Rn (k) statistique du test pénalisée aux bords Soit ϕ une fonction continue par morceaux sur [0, 1] satisfaisant : Z 0 1 ϕ(t) √ t 2 dt < ∞ statistique du test pénalisée k k ? Rn,ϕ (k) = ϕ( ) ϕ(1 − ) Rn (k) n n statistique pénalisée (2) comportement de la statistique du test pénalisée ∀ k1 ≤ k2 ? ? Cov(Rn,ϕ (k1 ) , Rn,ϕ (k2 )) = ϕ( kn1 ) ϕ(1 − kn1 ) ϕ( kn2 ) ϕ(1 − k2 k1 (1 − ) n n 2 ϕ( kn ) ϕ(1 − kn ) ? λ Var(Rn,ϕ (k)) = rk k (1 − ) n n k2 n) λ (3) fonction de pénalisation Si l’on prend ϕ(t) = t , l’équation (2) devient : statistique pénalisée pour la fonction ϕ(t) = t Kn (k) = n−3/2 (k Xn − n Xk ) équation (2) (4) fonction de pénalisation Si l’on prend ϕ(t) = t , l’équation (2) devient : statistique pénalisée pour la fonction ϕ(t) = t Kn (k) = n−3/2 (k Xn − n Xk ) (4) équation (2) Définition Pour tout estimateur consistant λ̂n de λ, soit K?n (k) = √1 Kn (k). λ̂n {K?n (t) ; On définit t ∈ [0, 1]} comme le processus interpolé linéaire du processus {K?n (k) ; 1 < k < n}. comportement de K?n sous l’hypothèse H0 Théorème sous l’hypothèse H0 , K?n (t) converge au sens de la convergence en loi des marginales de dimension finie vers le pont Brownien B(t) = W (t) − t W (1) où {W (t) ; t ∈ [0, 1]} représente le mouvement Brownien. Preuve Par l’équation (3)on a : ∀t1 ≤ t2 cov(Kn (t1 ) , Kn (t2 )) = [nt1 ] [nt2 ] (1 − )λ n n Or, lim Cov(K?n (t1 ) , K?n (t2 )) = t1 (1 − t2 ) n→∞ D’autre part, on a : t1 ≤ t2 , Cov(B(t1 ), B(t2 )) = t1 (1 − t2 ) (5) Proposition Sous H0 , pour tout η > 0, on a : lim PH0 ( sup |K?n (t)| ≥ η) = P ( sup |B(t)| ≥ η) n→∞ t∈[0,1] t∈[0,1] (6) Proposition Sous H0 , pour tout η > 0, on a : lim PH0 ( sup |K?n (t)| ≥ η) = P ( sup |B(t)| ≥ η) n→∞ t∈[0,1] (6) t∈[0,1] Conséquence Soit τ̂n = Arg sup |K?n (t)| et τ = Arg sup |B(t)|. Alors, t∈[0,1] t∈[0,1] P τ̂n −→ τ n→∞ (7) sous l’hypothèse H1 E[Xi ] = iλ si 1 ≤ i ≤ k δ k λ + (i − k) (λ + √ ) n si k + 1 ≤ i ≤ n pour tout k1 et k2 , kλ + (min(k , k ) − k)(λ + √δ ) si min(k , k ) ≥ k 1 2 1 2 Cov(Xk1 , Xk2 ) = n min(k , k ) λ sinon 1 2 comportement de K?n sous l’hypothèse H1 Théorème sous l’hypothèse H1 , K?n converge au sens de la convergence en loi des marginales de dimension finie vers le processus process Bτ? défini : δ Bτ? (t) = (t ∧ τ ) (1 − t ∨ τ ) √ + B(t) (8) λ où t ∧ τ = inf{t, τ } et t ∨ τ = sup{t, τ } Zone de rejet Nous prenons comme région de rejet : où pour α donné dans [0, 1], le seuil ηα est déterminé par : P ( sup |B(t)| ≥ ηα ) = 2 t∈[0,1] ∞ X (−1)j+1 e −2 j 2 2 ηα (9) j=1 Kolmogorov On note que le test étudié a le même niveau asymptotique que le test classic de Kolmogorov Puissance du test puissance du test p(τ ) = P ( sup |Bτ? (t)| ≥ ηα ) t∈[0,1] (10) Plan Introduction Modèle statistique Modèle de détection Comportements des observations sous l’hypothèse H0 Statistique du test pénalisée aux bords Comportements des observations sous l’hypothèse H0 Construction du test Applications cas HSU (haemolytic uraemic syndrome) cas SIDA HSU (haemolytic uraemic syndrome) Les données représentent le nombre de ’HUS’ à Birmingham et Newcastle de 1970 à 1989. référence R. W. West & R. T. Ogden. (1997). Continuous-time estimation of a change-point in a Poisson process. Journ. Statist. Comput. Simul. 56, pp 293-302. HSU (Birmingham) graphe de |K?n (k)| pour les données de Birmingham . estimation (Birmingham) xn λ̂n = = 5.65 n le maximum est atteint au point : k = 11, ce qui correspond à la valeur de statistique : |K?n (11)| = 4.15. Pour α = 5%, la valeur critique ηα = 1.36, on rejette donc l’hypothèse reject H0 . δ = |Kn (11)| = 9.87, ce qui donne une puissance ègale à 41%. HSU (Newcastle) graphe de |K?n (k)| pour les données de Newcastle . estimation (Newcastle) xn λ̂n = = 5. n le maximum est atteint au point : k = 15, ce qui correspond à la valeur de statistique : |K?n (11)| = 1.6994. Pour α = 5%, la valeur critique ηα = 1.36, on rejette donc l’hypothèse reject H0 . δ = |Kn (15)| = 8.50, ce qui donne une puissance ègale à 21%. SIDA (cuba) Les données représentent le nombre de ’SIDA’ au Cuba de 1986 à 1992. référence The HIV-AIDS Epidemic in Cuba. Internal Report. Departamento de Epidemiologia, Sanatorio Santiago de Las Vegas. Cuba 1999. SIDA (cuba) graphe de |K?n (k)| pour les données SIDA au Cuba . estimation (SIDA) λ̂n = xnn = 32.15 le maximum est atteint au point : k = 12, ce qui correspond à la valeur de statistique : |K?n (11)| = 9.61. Pour α = 5%, la valeur critique ηα = 1.36, on rejette donc l’hypothèse reject H0 . δ = |Kn (15)| = 54.49, ce qui donne une puissance ègale à 98%.