Feuille 5
Transcription
Feuille 5
Maîtrise 2003/2004. Statistique. Feuille 5. Exercice 1. Soit (X1 , . . . , Xn ) un échantillon d’une certaine loi. Calculer l’information de Fisher dans les cas suivants : 1) X1 suit une loi de Bernoulli de paramètre p ∈ (0, 1). 2) X1 suit une loi exponentielle de paramètre λ > 0. 3) X1 suit une de Poisson de paramètre λ > 0. Exercice 2. 1) On admet que la durée de vie, exprimée dans une unité de temps convenablement choisie, d’un certain type de matériel est représenté par une variable aléatoire X suivant une loi de Weibull de paramètre θ, a et c positifs. Cette loi, notée W (θ, a, c) a pour fonction de répartition (x − a)c F (x) = 1 − exp − 1I(x ≥ a). θ a? 1.1) Calculer la densité f de X. 1.2) Montrer que la variable Y = 2θ (X − a)c suit la loi du χ22 . Que représente le paramètre 1.3) Pour x ≥ a, on appelle taux de panne instantané à l’instant x, la quantité F (x + ∆x) − F (x) f (x) = . ∆x→0 ∆x(1 − F (x)) 1 − F (x) τ (x) = lim Quelle interprétation peut-on donner? Déduire la valeur de τ (x) pour une loi de Weibull. En fonction des valeurs de c, donner les trois classes typiques d’appareils. 2) Dans la suite on supposera connus les paramètres a et c de la loi W (θ, a, c), le paramètre θ étant inconnu. De plus, on diposera d’un échantillon (X1 , . . . , Xn ) des durées de vie observées sur n matériels du type considéré, Xi étant des réalisations i.i.d. de la variable X. 2.1) Construire l’estimateur du maximum de vraisemblance θ̂n de θ. 2.2) Cet estimateur est-il consistant ? 3) Construire un intervalle de confiance pour θ de niveau 90%, puis l’intervalle de confiance asymptotique de niveau 90%. Application numérique : n = 50, θ̂n = 2.3. 1 Exercice 3. (Problème de sondage) Soit N le nombre total d’habitants d’un pays. On entreprend un sondage de popularité de deux candidats (candidat A et candidat B) pour les élections. On choisit un échantillon de n habitants et on pose à chacun d’eux la question : “ Pour qui voterez-vous aux élections ?”. A l’issue de ce sondage, on obtient les données X1 , . . . , Xn , où pour i = 1, . . . , n, 1, si le i-ème habitant préfère le candidat A, Xi = 0, si le i-ème habitant préfère le candidat B. Pour des raisons évidentes, il est impossible de questionner tous les habitants. Donc n < N (en pratique n << N ). Le but du sondage est d’estimer la part µ d’habitants du pays qui préfèrent le candidat A. Il est pratique d’introduire les valeurs non aléatoires x1 , . . . , xN , où pour j = 1, . . . , N, 1, si le j − me habitant prfre le candidat A, xj = 0, si le j − me habitant prfre le candidat B. Avec cette notation µ = 1 N PN j=1 xj . 1) Discuter du modèle. Donner la loi de Xi pour tout i. Donner la loi de nX̄n . Montrer que E(X̄n ) = µ. 2) Montrer que Cov(Xi , Xj ) = −σ 2 /(N − 1), i 6= j, où N 1 X σ = (xj − µ)2 , N j=1 2 est la variance de la population, puis que σ2 Var(X̄n ) = n 3) Calculer E(s2 ), où s2 = 1 n Pn i=1 n−1 1− . N −1 (Xi − X̄n )2 . 4) On considère ici l’asymptotique quand N → ∞ et n = n(N ) → ∞, n/N → 0. 4.1) Montrer que X̄n est un estimateur consistant de µ et s2 est un estimateur consistant de 2 σ . 4.2) Prouver la normalité asymptotique √ n(X̄n − µ) L → N (0, 1), s puis donner l’intervalle de confiance asymptotique de niveau 1 − α pour µ (0 < α < 1). Application numérique : Donner les Pnintervalles de confiance asymptotiques au niveau 95% pour µ, avec N = 30M, n1 /n = i=1 1I(Xi = 1)/n = 0.52 et n prenant les valeurs n = 100, 1000, 10000. 2