cours 10

Transcription

cours 10
Cours 8
Les tests statistiques
Intervalle de confiance
pour une proportion
●
Dans le cas de grands échantillons
et n(1-p)>5 )
(np>5
l'intervalle de confiance au niveau (1- α )
est pour la proportion inconnue p :
f=k/n
ic(1-α) =]f-u(1-α/2)σ/sqrt(f(1-f)/n) ;
m+u(1-α/2)σ/sqrt(f(1-f)/n)[
on utilise la fonction prop.test()
Exemple : k=121 n=241
prop.test(121,241) ;
1-sample proportions test with continuity
correction
data:
121 out of 241, null probability 0.5
X-squared = 0, df = 1, p-value = 1
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.4373710 0.5667112
sample estimates:
p
●
0.502074
Intervalles de confiance
pour une moyenne,
Dans le cas de grands échantillons ou de
petits avec hypothèse de normalité,
l'intervalle de confiance au niveau (1- α)
est obtenu par :
IC(1-α) =]m-t(1-α/2) σ/sqrt(n) ; m+t(1-α/2)σ/sqrt(n[
la fonction R correspondante est :t.test()
exemple: A=iris[,1] ;
t.test(A,conf.level=0,9)$conf.int
[1] 5.731427 5.955240
attr(,"conf.level")
[1] 0.9
Dans le cas de petits echantillons, on fait un
calcul exact, car nP suit une loi binomiale de
paramètres n et p, on utilise la fonction
binom.test()
Exemple
data:
binom.test(121,241)
121 and 241
number of successes = 121, number of trials =
241, p-value = 1
alternative hypothesis: true probability of
success is not equal to 0.5
95 percent confidence interval:
0.4371893 0.5669084
sample estimates:
probability of success
0.5020747
Tableau récapitulatif
type
proportion
moyenne
variance
corrélation
Condition de
validité
np>5 et
n(1-p)>5
aucune
Fonction R
prop.test(x)
$conf
binom.test(x)
$conf
n>30 ou normale t.test(x)$conf
normale
sigma2.test(x)
$conf
binormale
Cor.test(x)
$conf
les test du chi-deux
La fonction
chisq.test(x,y,p)
Premier exemple:
on lance un dé 300 fois et on obtient le résultat suivant:
1
2
3
4
5
6
43
49
56
45
66
41
x=c(43, 49, 56, 45, 66, 41)
prob=rep(1/6,6)
chisq.test(x,p=prob)
Chi-squared test for given probabilities
data: x
X-squared = 8.96, df = 5, p-value = 0.1107
Second exemple sur un tableau de
contingence
Exemple d ’un tableau donnant la cécité en fonction
du sexe:
tab=matrix(c(442,514,38,6),nrow=2,byrow=TRUE)
colnames(tab)=c("homme","femme")
rownames(tab)=c("voyant","aveugle")
voyant
aveugle
homme femme
442
514
38
6
X2=chisq.test(tab,correct=FALSE)
On teste s ’il y a une relation entre
sexe et cécité (l ’hypothèse par défaut
est celle d ’indépendance)
Pearson's Chi-squared test
data: tab
X-squared = 27.1387, df = 1, p-value = 1.894e-07
attributes(X2)
$names
[1] "statistic" "parameter" "p.value"
"method"
"data.name" "observed"
[7] "expected" "residuals"
$class
[1] "htest »
par exemple:
X2$expected
homme femme
voyant 458.88 497.12
aveugle 21.12 22.88
valeurs attendues sous hypothèse d ’indépendance
X2$residuals
homme
femme
voyant -0.787994 0.7570801
aveugle 3.673039 -3.5289413
sum(X2$residuals^2)
27.13874 la somme des carrés des résidus est la
valeur du chi-deux
• Soit le tableau de contingence suivant:
•
roux blond brun
• bleu
13
20
7
• marron
24
10
18
• le test du chi-deux d ’indépendance
s ’effectue ainsi:
• chisq.test(m)
•
Pearson's Chi-squared test
• data: m
• X-squared = 10.0494, df = 2, p-value =
0.006574
on teste l ’hypothèse nulle suivante
« H0:il y a indépendance entre la couleur des
yeux et celle des cheveux »
Test sur une moyenne:
t.test()
• Pour comparer une moyenne à une valeur de
référence (cas d'un échantillon)
Le test Ho : m=m0
H : (m>m0 ou m<m0)
Sous H0 la statistique de test est
T= sqrt(n) (X-m0)/σ et suit une loi de student à n1 ddl
Mesure=IMC>30
t.test(mesure, mu=0,58,alternative =
c("two.sided", "less", "greater"),
conf.level = 0.95, correct = TRUE)
Data mesure t=1,52 df=8 p-value=0,082
alternative hypothesis:true mean is different
from 0,58
95 percent confidence interval 0,57 inf
Sample estimates mean of x 0,6188
nature
données
validité
Fonction R
1 échantillon
n>30 ou normal
t.test(x,...)
2 échantillons
t.test(x,y,..)
2 échantillons
Normalité et
variances égales
normalité
2 éch appariés
n>30 ou normalité
t.test(x,y,paired=
T)
1 échantillon
normal
Sigma2.test(x,..)
2 échantillons
2 échantillons
Normalité
Grands
échantillons
var.test(x,y,...)a
symp.test(x,y,...)
1 échantillon
1 échantillon
np>5 et n(1-p)>5
prop.test(x,...)
Binom.test(x,..)
2 échantillons
grands
prop.test(x,y,...)
1 echantillon
Normalité, Ho:r=r0 cor.test(x,y)
2 echantillons
normalité
Tests paramétriques
moyenne
variance
proportion
correlation
t.test(x,y,var.equ
al=F)
cor.test.2.sample(
x,y,...)
Tests du chi-deux
nature
données
validité
Fonction R
Tableau de
contingence
Effectifs
théoriques >5
Chi.test(,corre
ct=F)
1 échantillon
Effectifs
théoriques >5
Chi.test()
Tests
d'indépendance
Tests
d'ajustement

Documents pareils