Comparaison d`une distribution empirique à une distribution

Transcription

Comparaison d`une distribution empirique à une distribution
Comparaison d'une distribution empirique
à une distribution normale
Voici un échantillon de scores d'extraversion (scores brutes) :
extraversion <c(7,10,13,21,21,21,22,22,24,26,27,28,28,30,31,32,33,35,36,38)
Dans quelle mesure peut-on assimiler cet échantillon à une distribution normale?
Superposition
Superposons à l'histogramme représentant la distribution empirique une distribution normale de
même moyenne et de même variance que la population dont est issu l'échantillon (ces paramètres
sont estimés).
hist(extraversion, probability=TRUE)
x1<-seq(5, 40, by=0.01)
y1<-dnorm(x, mean=mean(extraversion), sd=sd(extraversion))
lines(x1, y1, type="l")
0.03
0.00
0.01
0.02
Density
0.04
0.05
0.06
Histogram of extraversion
5
10
15
20
25
30
35
40
extraversion
Etant donné la petite taille de l'échantillon il est possible que la population dont il est issu soit
normale!
Diagramme des pourcent-pourcent (PP-Plot)
Calculons pour chaque score observé la fréquence cumulée :
x <- sort(unique(extraversion))
n <- table(extraversion)
dimnames(n) <- NULL
N <- cumsum(n)
F <- (N-n/2)/sum(n)
Pour chaque score calculons également la fréquence cumulée attendue :
z <- (x-mean(extraversion))/sd(extraversion)
Phi <- pnorm(z)
Représentons les fréquences cumulées attendues en fonction des fréquences cumulées observées :
plot(F, Phi, xlim=c(0,1), ylim=c(0,1), xlab=”F observé”, ylab=”F
attendu”, main=”P-P Plot”)
abline(0,1)
grid()
0.6
0.4
0.0
0.2
F attendu
0.8
1.0
P-P Plot
0.0
0.2
0.4
0.6
0.8
1.0
F observé
Si les points se situent tous sur la première diagonale principale nous pouvons conclure que les deux
distributions (empirique et théorique) sont les mêmes! C'est grosso modo le cas dans notre exemple.
Annexe
Construisons le tableau des calculs:
round(cbind(x, n, N, F, z, Phi), 3)
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[7,]
[8,]
[9,]
[10,]
[11,]
[12,]
[13,]
[14,]
[15,]
[16,]
x
7
10
13
21
22
24
26
27
28
30
31
32
33
35
36
38
n
1
1
1
3
2
1
1
1
2
1
1
1
1
1
1
1
N
1
2
3
6
8
9
10
11
13
14
15
16
17
18
19
20
F
0.025
0.075
0.125
0.225
0.350
0.425
0.475
0.525
0.600
0.675
0.725
0.775
0.825
0.875
0.925
0.975
z
-2.168
-1.812
-1.456
-0.505
-0.386
-0.149
0.089
0.208
0.327
0.564
0.683
0.802
0.921
1.159
1.277
1.515
Phi
0.015
0.035
0.073
0.307
0.350
0.441
0.536
0.582
0.628
0.714
0.753
0.789
0.821
0.877
0.899
0.935