Question 1 : tnhtnh

Transcription

Question 1 : tnhtnh
Question 1 :
tnh<-read.table(‘C :LE-OBEGI-OUARTI.txt’)
X=tnh[,1]
tmpFunc=function(X)
{
tmp=vector("integer",0)
for(i in 2:length(X))
{
if(X[i]==X[i-1]){tmp=c(tmp,i)}
}
if(length(tmp)>0){X=X[-tmp]}
return(X)
}
V=tmpFunc(X)
Z=log(V)
A=hist(Z,prob=T)
A=hist(Z,prob=T,breaks=c(0,6.2,7,7.3,7.6,7.9,8.2,8.5,8.9,9.2,13))
intervalles tel que les i > 5 %
On vérifie notre choix :
C=c(6.2,7,7.3,7.6,7.9,8.2,8.5,8.9,9.2,13)
prob=function(C){
p=c()
for(i in 1:10){
p=c(p,mean(Z<C[i])) ;
}
p;
pf=c(p[1])
for(i in 2:10){
pf=c(pf,p[i]-p[i-1]) ;
}
pf
}
#On choisit dix
pf=prob(C)
On obtient :
[1] 0.11910185 0.12040351 0.07354377 0.09827530 0.11910185 0.11649854
[7] 0.11584771 0.10901399 0.06573381 0.06247966
Ainsi on a le vecteur :
=( 0.11910185 , 0.12040351 , 0.07354377 , 0.09827530 , 0.11910185 , 0.11649854 ,
0.11584771 , 0.10901399 , 0.06573381 , 0.06247966 )
Question 2 :
Pour obtenir le vecteur des proportions correspondant au modèle à 10 classes, on crée la
fonction suivante :
quant=function(X) {
C=c(6.2,7,7.3,7.6,7.9,8.2,8.5,8.9,9.2,13)
q=c()
for(i in 1:10){
q=c(q,mean(X<C[i]))
}
q;
qg=c(q[1])
for(i in 2:10){
qg=c(qg,q[i]-q[i-1])
}
qg
}
Approximation numérique du vecteur q , q étant le vecteur des proportions correspondant au
modèle à 10 classes issu de la loi Gamma avec les estimateur obtenus analytiquement par la
méthode des moments :
b=4.303776
a= 32.74471
x0= 0
gmmana=rgamma(10000,a,b)
qma=quant(gmmana)
On obtient donc le vecteur q suivant :
[1] 0.1381 0.2010 0.0909 0.0934 0.0873 0.0778 0.0712 0.0731 0.0450 0.1219
q=(0.1381 , 0.2010 0.0909 , 0.0934 , 0.0873 , 0.0778 , 0.0712 , 0.0731 , 0.0450 , 0.1219)
Approximation numérique du vecteur q , q étant le vecteur des proportions correspondant au
modèle à 10 classes issu de la loi Gamma avec les estimateur obtenus numériquement par la
méthode des moments :
a=29.0641457
b=4.0546919
x0=0.4403401
gmmnum=rgamma(10000,a,b) +x0
qmn=quant(gmmnum)
On obtient donc le vecteur q suivant :
[1] 0.1429 0.1994 0.0909 0.0927 0.0849 0.0807 0.0707 0.0789 0.0421 0.1165
q=( 0.1429 , 0.1994 , 0.0909 , 0.0927 , 0.0849 , 0.0807 , 0.0707 , 0.0789 , 0.0421 , 0.1165)
Approximation numérique du vecteur q , q étant le vecteur des proportions correspondant au
modèle à 10 classes issu de la loi Gamma avec les estimateur du maximum de vraisemblance
obtenus numériquement :
a=27.876860
b=3.397778
x0=0
gemvnum=rgamma(10000,a,b)
qemv=quant(gemvnum)
On obtient donc le vecteur q suivant :
[1] 0.0867 0.1406 0.0682 0.0776 0.0821 0.0781 0.0702 0.0920 0.0613 0.2392
q=(0.0867 , 0.1406 , 0.0682 , 0.0776 , 0.0821 , 0.0781 0.0702 , 0.0920 , 0.0613 , 0.2392)
Les statistiques obtenues pour
:
chi1=length(Z)*sum((pf-qma)^2/qma )
chi1
On obtient :
[1] 471.6837
=471.6837
: avec les estimateurs analytiques de la méthode des moments
chi2=length(Z)*sum((pf-qmn)^2/qmn )
chi2
On obtient :
[1] 452.3688
=452.3688
: avec les estimateurs numériques de la méthode des moments
chi3=length(Z)*sum((pf-qemv)^2/qemv )
chi3
On obtient :
[1] 676.6852
=676.6852
: avec les estimateurs numériques du maximum de vraisemblance.
Question 3 :
pchisq est la fonction de répartition de la loi
p1=1-pchisq(chi1,9)
p1
[1] 0
à n degré de liberté
# 9 étant le degré de liberté
p2=1-pchisq(chi2,9)
p2
[1] 0
p3=1-pchisq(chi3,9)
p3
[1] 0
Nous souhaitons la p-valeur la plus grande :
Les p-valeurs valant toutes 0, nous les comparons par rapport à leur statistiques
et ainsi
nous retenons alors la statistique du
la plus petite puisque la fonction de répartition est
croissante :
= 452.3688
Donc l'estimateur numérique obtenu à partir de la méthode des moments.
Lors de la partie 2 du projet notre choix était aussi cet estimateur donc ces conclusions sont
conformes.
Question 4 :
Nous allons montrer que la statistique du
pour ce test a déjà été calculée
Premièrement la loi Gamma translatée est de la famille exponentielle, en effet :
De plus
est C² et E[
]< +∞ , donc on a que le modèle faisant parti de la famille
exponentielle est régulier et identifiable.
Nous savons, d’après la deuxième partie du projet lorsque nous l’avons calculé, qu’il existe
une unique REV, or un corollaire du chapitre 7 nous dit que si de plus le modèle est régulier
et identifiable, alors
est asymptotiquement efficace.
Par ailleurs, un théorème du chapitre 7 dit que pour les modèles de famille exponentielle, si la
REV existe et est sans biais, alors elle coïncide aussi avec l’estimateur de variance minimale.
Puisque les conditions sont vérifiées, on peut se ramener au test d’adéquations à la loi
q=p(
)
On calcule les p-valeurs pour une
pval1=1-pchisq(chi1,7)
pval1
[1] 0
pval2=1-pchisq(chi2,7)
pval2
[1] 0
car d=2 et N=10
# 7 étant le degré de liberté
pval3=1-pchisq(chi3,7)
pval3
[1] 0
Nous souhaitons la p-valeur la plus grande :
Les p-valeurs valant toutes 0, nous les comparons par rapport à leur statistiques
nous retenons alors la statistique du
la plus petite :
= 452.3688
Donc l'estimateur numérique obtenu à partir de la méthode des moments.
La p-valeur étant plus petite que 1%, on rejette H0 : le modèle n’est pas adéquat.
et ainsi
Question 5 :
Soit P une loi suivant une loi uniforme sur [a,b] : P~U([a,b])
Par la méthode des moments, on obtient les estimateurs :
=
=
+
a= mean(Z)- sqrt(3*(mean(Z^2)-(mean(Z)^2)))
b= mean(Z)+ sqrt(3*(mean(Z^2)-(mean(Z)^2)))
On obtient:
a=5.305434
b=9.911303
unimm=runif(10000,a,b)
qunimm=quant(unimm)
 [1] 0.1983 0.1692 0.0657 0.0600 0.0648 0.0638 0.0704 0.0901 0.0634 0.1543
Par la méthode du maximum de vraisemblance
On a :
=
=
Donc on obtient :
a=0
b=12.96741
uniemv=runif(10000,a,b)
quniemv=quant(uniemv)
 [1] 0.4823 0.0638 0.0229 0.0219 0.0223 0.0219 0.0220 0.0307 0.0238 0.2884
On calcule les statistiques du
chi4=length(Z)*sum((pf- qunimm)^2/ qunimm )
chi4
On obtient :
[1] 737.7866
chi5=length(Z)*sum((pf- quniemv)^2/ quniemv )
chi5
On obtient :
[1] 6624.811
Les p-valeurs obtenues sont proches de 0, on compare les deux statistiques et on choisit la
statistique la plus petite c’est-à-dire celle obtenue par la méthode des moments.
En comparant avec les statistiques obtenues avec la Gamma translatée, la plus petite
statistique est obtenue avec la Gamma translatée.
Donc le modèle utilisée dans la littérature n’est pas plus adéquat que la Gamma translatée
pour approcher nos données.