Question 1 : tnhtnh
Transcription
Question 1 : tnhtnh
Question 1 : tnh<-read.table(‘C :LE-OBEGI-OUARTI.txt’) X=tnh[,1] tmpFunc=function(X) { tmp=vector("integer",0) for(i in 2:length(X)) { if(X[i]==X[i-1]){tmp=c(tmp,i)} } if(length(tmp)>0){X=X[-tmp]} return(X) } V=tmpFunc(X) Z=log(V) A=hist(Z,prob=T) A=hist(Z,prob=T,breaks=c(0,6.2,7,7.3,7.6,7.9,8.2,8.5,8.9,9.2,13)) intervalles tel que les i > 5 % On vérifie notre choix : C=c(6.2,7,7.3,7.6,7.9,8.2,8.5,8.9,9.2,13) prob=function(C){ p=c() for(i in 1:10){ p=c(p,mean(Z<C[i])) ; } p; pf=c(p[1]) for(i in 2:10){ pf=c(pf,p[i]-p[i-1]) ; } pf } #On choisit dix pf=prob(C) On obtient : [1] 0.11910185 0.12040351 0.07354377 0.09827530 0.11910185 0.11649854 [7] 0.11584771 0.10901399 0.06573381 0.06247966 Ainsi on a le vecteur : =( 0.11910185 , 0.12040351 , 0.07354377 , 0.09827530 , 0.11910185 , 0.11649854 , 0.11584771 , 0.10901399 , 0.06573381 , 0.06247966 ) Question 2 : Pour obtenir le vecteur des proportions correspondant au modèle à 10 classes, on crée la fonction suivante : quant=function(X) { C=c(6.2,7,7.3,7.6,7.9,8.2,8.5,8.9,9.2,13) q=c() for(i in 1:10){ q=c(q,mean(X<C[i])) } q; qg=c(q[1]) for(i in 2:10){ qg=c(qg,q[i]-q[i-1]) } qg } Approximation numérique du vecteur q , q étant le vecteur des proportions correspondant au modèle à 10 classes issu de la loi Gamma avec les estimateur obtenus analytiquement par la méthode des moments : b=4.303776 a= 32.74471 x0= 0 gmmana=rgamma(10000,a,b) qma=quant(gmmana) On obtient donc le vecteur q suivant : [1] 0.1381 0.2010 0.0909 0.0934 0.0873 0.0778 0.0712 0.0731 0.0450 0.1219 q=(0.1381 , 0.2010 0.0909 , 0.0934 , 0.0873 , 0.0778 , 0.0712 , 0.0731 , 0.0450 , 0.1219) Approximation numérique du vecteur q , q étant le vecteur des proportions correspondant au modèle à 10 classes issu de la loi Gamma avec les estimateur obtenus numériquement par la méthode des moments : a=29.0641457 b=4.0546919 x0=0.4403401 gmmnum=rgamma(10000,a,b) +x0 qmn=quant(gmmnum) On obtient donc le vecteur q suivant : [1] 0.1429 0.1994 0.0909 0.0927 0.0849 0.0807 0.0707 0.0789 0.0421 0.1165 q=( 0.1429 , 0.1994 , 0.0909 , 0.0927 , 0.0849 , 0.0807 , 0.0707 , 0.0789 , 0.0421 , 0.1165) Approximation numérique du vecteur q , q étant le vecteur des proportions correspondant au modèle à 10 classes issu de la loi Gamma avec les estimateur du maximum de vraisemblance obtenus numériquement : a=27.876860 b=3.397778 x0=0 gemvnum=rgamma(10000,a,b) qemv=quant(gemvnum) On obtient donc le vecteur q suivant : [1] 0.0867 0.1406 0.0682 0.0776 0.0821 0.0781 0.0702 0.0920 0.0613 0.2392 q=(0.0867 , 0.1406 , 0.0682 , 0.0776 , 0.0821 , 0.0781 0.0702 , 0.0920 , 0.0613 , 0.2392) Les statistiques obtenues pour : chi1=length(Z)*sum((pf-qma)^2/qma ) chi1 On obtient : [1] 471.6837 =471.6837 : avec les estimateurs analytiques de la méthode des moments chi2=length(Z)*sum((pf-qmn)^2/qmn ) chi2 On obtient : [1] 452.3688 =452.3688 : avec les estimateurs numériques de la méthode des moments chi3=length(Z)*sum((pf-qemv)^2/qemv ) chi3 On obtient : [1] 676.6852 =676.6852 : avec les estimateurs numériques du maximum de vraisemblance. Question 3 : pchisq est la fonction de répartition de la loi p1=1-pchisq(chi1,9) p1 [1] 0 à n degré de liberté # 9 étant le degré de liberté p2=1-pchisq(chi2,9) p2 [1] 0 p3=1-pchisq(chi3,9) p3 [1] 0 Nous souhaitons la p-valeur la plus grande : Les p-valeurs valant toutes 0, nous les comparons par rapport à leur statistiques et ainsi nous retenons alors la statistique du la plus petite puisque la fonction de répartition est croissante : = 452.3688 Donc l'estimateur numérique obtenu à partir de la méthode des moments. Lors de la partie 2 du projet notre choix était aussi cet estimateur donc ces conclusions sont conformes. Question 4 : Nous allons montrer que la statistique du pour ce test a déjà été calculée Premièrement la loi Gamma translatée est de la famille exponentielle, en effet : De plus est C² et E[ ]< +∞ , donc on a que le modèle faisant parti de la famille exponentielle est régulier et identifiable. Nous savons, d’après la deuxième partie du projet lorsque nous l’avons calculé, qu’il existe une unique REV, or un corollaire du chapitre 7 nous dit que si de plus le modèle est régulier et identifiable, alors est asymptotiquement efficace. Par ailleurs, un théorème du chapitre 7 dit que pour les modèles de famille exponentielle, si la REV existe et est sans biais, alors elle coïncide aussi avec l’estimateur de variance minimale. Puisque les conditions sont vérifiées, on peut se ramener au test d’adéquations à la loi q=p( ) On calcule les p-valeurs pour une pval1=1-pchisq(chi1,7) pval1 [1] 0 pval2=1-pchisq(chi2,7) pval2 [1] 0 car d=2 et N=10 # 7 étant le degré de liberté pval3=1-pchisq(chi3,7) pval3 [1] 0 Nous souhaitons la p-valeur la plus grande : Les p-valeurs valant toutes 0, nous les comparons par rapport à leur statistiques nous retenons alors la statistique du la plus petite : = 452.3688 Donc l'estimateur numérique obtenu à partir de la méthode des moments. La p-valeur étant plus petite que 1%, on rejette H0 : le modèle n’est pas adéquat. et ainsi Question 5 : Soit P une loi suivant une loi uniforme sur [a,b] : P~U([a,b]) Par la méthode des moments, on obtient les estimateurs : = = + a= mean(Z)- sqrt(3*(mean(Z^2)-(mean(Z)^2))) b= mean(Z)+ sqrt(3*(mean(Z^2)-(mean(Z)^2))) On obtient: a=5.305434 b=9.911303 unimm=runif(10000,a,b) qunimm=quant(unimm) [1] 0.1983 0.1692 0.0657 0.0600 0.0648 0.0638 0.0704 0.0901 0.0634 0.1543 Par la méthode du maximum de vraisemblance On a : = = Donc on obtient : a=0 b=12.96741 uniemv=runif(10000,a,b) quniemv=quant(uniemv) [1] 0.4823 0.0638 0.0229 0.0219 0.0223 0.0219 0.0220 0.0307 0.0238 0.2884 On calcule les statistiques du chi4=length(Z)*sum((pf- qunimm)^2/ qunimm ) chi4 On obtient : [1] 737.7866 chi5=length(Z)*sum((pf- quniemv)^2/ quniemv ) chi5 On obtient : [1] 6624.811 Les p-valeurs obtenues sont proches de 0, on compare les deux statistiques et on choisit la statistique la plus petite c’est-à-dire celle obtenue par la méthode des moments. En comparant avec les statistiques obtenues avec la Gamma translatée, la plus petite statistique est obtenue avec la Gamma translatée. Donc le modèle utilisée dans la littérature n’est pas plus adéquat que la Gamma translatée pour approcher nos données.