cours 10
Transcription
cours 10
Cours 8 Les tests statistiques Intervalle de confiance pour une proportion ● Dans le cas de grands échantillons et n(1-p)>5 ) (np>5 l'intervalle de confiance au niveau (1- α ) est pour la proportion inconnue p : f=k/n ic(1-α) =]f-u(1-α/2)σ/sqrt(f(1-f)/n) ; m+u(1-α/2)σ/sqrt(f(1-f)/n)[ on utilise la fonction prop.test() Exemple : k=121 n=241 prop.test(121,241) ; 1-sample proportions test with continuity correction data: 121 out of 241, null probability 0.5 X-squared = 0, df = 1, p-value = 1 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4373710 0.5667112 sample estimates: p ● 0.502074 Intervalles de confiance pour une moyenne, Dans le cas de grands échantillons ou de petits avec hypothèse de normalité, l'intervalle de confiance au niveau (1- α) est obtenu par : IC(1-α) =]m-t(1-α/2) σ/sqrt(n) ; m+t(1-α/2)σ/sqrt(n[ la fonction R correspondante est :t.test() exemple: A=iris[,1] ; t.test(A,conf.level=0,9)$conf.int [1] 5.731427 5.955240 attr(,"conf.level") [1] 0.9 Dans le cas de petits echantillons, on fait un calcul exact, car nP suit une loi binomiale de paramètres n et p, on utilise la fonction binom.test() Exemple data: binom.test(121,241) 121 and 241 number of successes = 121, number of trials = 241, p-value = 1 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.4371893 0.5669084 sample estimates: probability of success 0.5020747 Tableau récapitulatif type proportion moyenne variance corrélation Condition de validité np>5 et n(1-p)>5 aucune Fonction R prop.test(x) $conf binom.test(x) $conf n>30 ou normale t.test(x)$conf normale sigma2.test(x) $conf binormale Cor.test(x) $conf les test du chi-deux La fonction chisq.test(x,y,p) Premier exemple: on lance un dé 300 fois et on obtient le résultat suivant: 1 2 3 4 5 6 43 49 56 45 66 41 x=c(43, 49, 56, 45, 66, 41) prob=rep(1/6,6) chisq.test(x,p=prob) Chi-squared test for given probabilities data: x X-squared = 8.96, df = 5, p-value = 0.1107 Second exemple sur un tableau de contingence Exemple d ’un tableau donnant la cécité en fonction du sexe: tab=matrix(c(442,514,38,6),nrow=2,byrow=TRUE) colnames(tab)=c("homme","femme") rownames(tab)=c("voyant","aveugle") voyant aveugle homme femme 442 514 38 6 X2=chisq.test(tab,correct=FALSE) On teste s ’il y a une relation entre sexe et cécité (l ’hypothèse par défaut est celle d ’indépendance) Pearson's Chi-squared test data: tab X-squared = 27.1387, df = 1, p-value = 1.894e-07 attributes(X2) $names [1] "statistic" "parameter" "p.value" "method" "data.name" "observed" [7] "expected" "residuals" $class [1] "htest » par exemple: X2$expected homme femme voyant 458.88 497.12 aveugle 21.12 22.88 valeurs attendues sous hypothèse d ’indépendance X2$residuals homme femme voyant -0.787994 0.7570801 aveugle 3.673039 -3.5289413 sum(X2$residuals^2) 27.13874 la somme des carrés des résidus est la valeur du chi-deux • Soit le tableau de contingence suivant: • roux blond brun • bleu 13 20 7 • marron 24 10 18 • le test du chi-deux d ’indépendance s ’effectue ainsi: • chisq.test(m) • Pearson's Chi-squared test • data: m • X-squared = 10.0494, df = 2, p-value = 0.006574 on teste l ’hypothèse nulle suivante « H0:il y a indépendance entre la couleur des yeux et celle des cheveux » Test sur une moyenne: t.test() • Pour comparer une moyenne à une valeur de référence (cas d'un échantillon) Le test Ho : m=m0 H : (m>m0 ou m<m0) Sous H0 la statistique de test est T= sqrt(n) (X-m0)/σ et suit une loi de student à n1 ddl Mesure=IMC>30 t.test(mesure, mu=0,58,alternative = c("two.sided", "less", "greater"), conf.level = 0.95, correct = TRUE) Data mesure t=1,52 df=8 p-value=0,082 alternative hypothesis:true mean is different from 0,58 95 percent confidence interval 0,57 inf Sample estimates mean of x 0,6188 nature données validité Fonction R 1 échantillon n>30 ou normal t.test(x,...) 2 échantillons t.test(x,y,..) 2 échantillons Normalité et variances égales normalité 2 éch appariés n>30 ou normalité t.test(x,y,paired= T) 1 échantillon normal Sigma2.test(x,..) 2 échantillons 2 échantillons Normalité Grands échantillons var.test(x,y,...)a symp.test(x,y,...) 1 échantillon 1 échantillon np>5 et n(1-p)>5 prop.test(x,...) Binom.test(x,..) 2 échantillons grands prop.test(x,y,...) 1 echantillon Normalité, Ho:r=r0 cor.test(x,y) 2 echantillons normalité Tests paramétriques moyenne variance proportion correlation t.test(x,y,var.equ al=F) cor.test.2.sample( x,y,...) Tests du chi-deux nature données validité Fonction R Tableau de contingence Effectifs théoriques >5 Chi.test(,corre ct=F) 1 échantillon Effectifs théoriques >5 Chi.test() Tests d'indépendance Tests d'ajustement