Estimation de la Distribution de la P value Bootstrap Au niveau
Transcription
Estimation de la Distribution de la P value Bootstrap Au niveau
Estimation de la Distribution de la P value Bootstrap Au niveau nominal α, le test bootstrap rejette si t < Q(α, µ∗ ). Ceci est équivalent à l’inégalité R(t, µ∗ ) < α, d’où on voit que R(t, µ∗ ) est la P value bootstrap. La probabilité de rejet sous le PGD µ0 est donc ¡ ¡ ¢ ¢ Pr µ0 R(t, µ∗ ) < α = Pr µ0 t < Q(α, µ∗ ) au niveau α. Soit F (α) cette probabilité, ce qui signifie que F est la fonction de répartition de la P value bootstrap R(t, µ∗ ). Si t et µ∗ sont indépendants, on a ³ ¯ ¢´ ¡ ¢ ¡ F (α) = Pr µ0 t < Q(α, µ∗ ) = Eµ0 Pr µ0 t < Q(α, µ∗ ) ¯ µ∗ ¡ ¢ = Eµ0 R(Q(α, µ∗ ), µ0 ) . (1) Ce résultat n’est exact que si t et µ∗ sont vraiment indépendants, mais il pourrait être une bonne approximation si on a une indépendance asymptotique. ¡ ¢ Nous savons que R Q(α, µ0 ), µ0 = α. Un développement de Taylor nous donne ¡ ¢ F (α) = Eµ0 R(Q(α, µ∗ ), µ0 ¡ ¢ ≈ R(Q(α, µ0 ), µ0 ) + n−1/2 r0 (·) Eµ0 Q(α, µ∗ ) − Q(α, µ0 ) ¡ ¢ = α + n−1/2 r0 (·) Eµ0 (Q(α, µ∗ )) − Q(α, µ0 ) , (2) où R(α, µ) = α + n−1/2 r(α, µ) si t est un pivot asymptotique, et r0 est la dérivée de r par rapport à son premier argument. La variable aléatoire t∗ est réalisée sous µ0 de la manière suivante. Un échantillon généré par le PGD µ0 est utilisé afin d’obtenir une réalisation µ̂ du PGD bootstrap µ∗ . On se sert ensuite de µ̂ pour générer un échantillon qu’on utilise pour le calcul d’une statistique bootstrap, qui est alors de t∗. La fonc¡ la réalisation ¢ ∗ ∗ tion de répartition de t , évaluée en α, est Eµ0 R(α, µ ) : conditionnellement à µ̂, la probabilité que t∗ < α est donnée par la fonction de répartition sous µ̂, c’est-à-dire, R(α, ¡ ¢ µ̂). L’espérance non conditionnelle de cette probabilité est donc Eµ0 R(α, µ∗ ) . Soit Q∗ (α) le quantile α de t∗. Alors Q∗ (α) vérifie l’équation ¡ ¢ Eµ0 R(Q∗ (α), µ∗ ) = α. Étant donné que R(Q(α, µ∗ ), µ∗ ) = α, ceci devient ¡ ¢ 0 = Eµ0 R(Q∗ (α), µ∗ ) − R(Q(α, µ∗ ), µ∗ ) ¡ ¢ ≈ n−1/2 r0 (·) Eµ0 Q∗ (α) − Q(α, µ∗ ) , (3) De (3) on obtient l’approximation ¡ ¢ Eµ0 Q(α, µ∗ ) = Q∗ (α). (4) 1 Cette nouvelle approximation permet de remplacer la probabilité approximative (2) par l’expression R(Q∗ (α), µ0 ), parce que, toujours approximativement, ¡ ¢ R(Q∗ (α), µ0 ) ≈ R(Q(α, µ0 ), µ0 ) + n−1/2 r0 (·) Q∗ (α) − Q(α, µ0 ) ¢ ¡ = α + n−1/2 r0 (·) Q∗ (α) − Q(α, µ0 ) . (5) Par (4), la membre de droite de cette équation est approximativement égal à (2). La procédure de simulation est comme suit. Pour chaque répétition m = 1, . . . , M , on se sert du PGD µ0 afin de générer une réalisation tm de la variable aléatoire t et une réalisation µ̂m du PGD bootstrap µ∗. Ensuite on se sert de µ̂m afin de générer une réalisation t∗m of t∗. La probabilité de rejet approximative R(Q∗ (α), µ0 ) peut alors être estimée par la proportion des tm inférieurs à Q∗ (α), le quantile α des t∗m . On obtient l’estimation suivante: M ¢ 1 X ¡ c I tm < Q̂∗ (α) . RPA ≡ M m=1 2