Comparaison d`une distribution empirique à une distribution
Transcription
Comparaison d`une distribution empirique à une distribution
Comparaison d'une distribution empirique à une distribution normale Voici un échantillon de scores d'extraversion (scores brutes) : extraversion <c(7,10,13,21,21,21,22,22,24,26,27,28,28,30,31,32,33,35,36,38) Dans quelle mesure peut-on assimiler cet échantillon à une distribution normale? Superposition Superposons à l'histogramme représentant la distribution empirique une distribution normale de même moyenne et de même variance que la population dont est issu l'échantillon (ces paramètres sont estimés). hist(extraversion, probability=TRUE) x1<-seq(5, 40, by=0.01) y1<-dnorm(x, mean=mean(extraversion), sd=sd(extraversion)) lines(x1, y1, type="l") 0.03 0.00 0.01 0.02 Density 0.04 0.05 0.06 Histogram of extraversion 5 10 15 20 25 30 35 40 extraversion Etant donné la petite taille de l'échantillon il est possible que la population dont il est issu soit normale! Diagramme des pourcent-pourcent (PP-Plot) Calculons pour chaque score observé la fréquence cumulée : x <- sort(unique(extraversion)) n <- table(extraversion) dimnames(n) <- NULL N <- cumsum(n) F <- (N-n/2)/sum(n) Pour chaque score calculons également la fréquence cumulée attendue : z <- (x-mean(extraversion))/sd(extraversion) Phi <- pnorm(z) Représentons les fréquences cumulées attendues en fonction des fréquences cumulées observées : plot(F, Phi, xlim=c(0,1), ylim=c(0,1), xlab=”F observé”, ylab=”F attendu”, main=”P-P Plot”) abline(0,1) grid() 0.6 0.4 0.0 0.2 F attendu 0.8 1.0 P-P Plot 0.0 0.2 0.4 0.6 0.8 1.0 F observé Si les points se situent tous sur la première diagonale principale nous pouvons conclure que les deux distributions (empirique et théorique) sont les mêmes! C'est grosso modo le cas dans notre exemple. Annexe Construisons le tableau des calculs: round(cbind(x, n, N, F, z, Phi), 3) [1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,] [14,] [15,] [16,] x 7 10 13 21 22 24 26 27 28 30 31 32 33 35 36 38 n 1 1 1 3 2 1 1 1 2 1 1 1 1 1 1 1 N 1 2 3 6 8 9 10 11 13 14 15 16 17 18 19 20 F 0.025 0.075 0.125 0.225 0.350 0.425 0.475 0.525 0.600 0.675 0.725 0.775 0.825 0.875 0.925 0.975 z -2.168 -1.812 -1.456 -0.505 -0.386 -0.149 0.089 0.208 0.327 0.564 0.683 0.802 0.921 1.159 1.277 1.515 Phi 0.015 0.035 0.073 0.307 0.350 0.441 0.536 0.582 0.628 0.714 0.753 0.789 0.821 0.877 0.899 0.935