Cours 4 Compléments

Transcription

Cours 4 Compléments
Cours 4
Compléments
Quelques résumés
statistiques
Les résumés numériques pour calculer des
statistiques sur un échantillon numérique
●
Moyenne arithmétique
mean()
●
Médiane d'un échantillon
median()
●
Minimum, maximum
min(), max()
●
Calcul des percentiles
quantile()
●
Variance
var()
●
Écart-type
sd()
●
Covariance, coefficient de corrélation
cov(),cor()
●
Résumé statistique
summary()
exemple
x=sample(1:50,20)
> x
[1] 33 3 49 23 38 29 21 27 28 47
42 19 5 24 10 34 41 43 1 8
> summary(x)
Min. 1st Qu. Median
Mean 3rd
Qu.
Max. 1.00
16.75
27.50
26.25
38.75
49.00
Les résumés graphiques
●
Pour des données discrètes ou
catégorielles
Diagramme en batons:
barplot()
Cette fonction prend comme argument
un objet résultat de la fonction
table()
●
pour des données continues, hist()
hist(x,breaks= « Sturges »,prob=FALSE)
●
●
X un vecteur de valeurs pour lequel on
souhaite un histogramme
breaks:soit
-un vecteur chaine de caractère donnant un
algorithme pour calculer le nombre
d'intervalles
-un nombre donnant le nombre d'intervalles
●
prob=FALSE:effectifs
●
prob=TRUE: fréquences
Eviter d ’écrire des boucles
Eviter d ’écrire des boucles:1
avec les fonctions apply()
lapply()sapply()
• apply(X, MARGIN, FUNC, ...) retourne un
vecteur de la taille appropriée, où
• X: tableau
• Margin
=1 pour les lignes, 2 pour les
colonnes
• Func: fonction '+', '%*%‘, mean,
sum,...
• lapply sapply() même fonction pour les
listes et les vecteurs
Eviter d ’écrire des
boucles (2)
• Exemple 1
n=10
p=0.2
x=0:n
y=choose(n,x)*p^x*(1-p)^(nx)
#ou bien y=dbinom(x,n,p)
plot(x,y,type="h",lwd=10)
• Exemple 2
prod(1:8); 40320
identique à factorial(8)
Un exemple d'utilisation du type factor
Le type factor:Un exemple
• Un facteur est un objet vecteur qui peut être
utilisé pour spécifier une classification
discrète des composants d’un autre vecteur de
même longueur
• Facteurs non ordonné:variable qualitative
• Facteurs ordonnés:variable
ordonnée
qualitative
• provenance=c("PA","PA","AG","RG","ME","CT",
"CT","SR","TP","EN","CL","ME","PA","AG","RG
","ME","CT","CT","SR","TP","EN")
• length(provenance)
• [1] 21
•
•
fprov=factor(provenance) ;fprov
[1] PA PA AG RG ME CT CT SR TP EN CL ME PA
AG RG ME CT CT SR TP EN
• Levels: AG CL CT EN ME PA RG SR TP
• levels(fprov)
• [1] "AG" "CL" "CT" "EN" "ME" "PA" "RG" "SR"
"TP"
•revenus=c(13000,14900,14000,16100,14500,16600,159
00,15400,17000,19000,14600,17000,18500,15800,14500
,16600,15900,15400,17000,19000,20000)
•revenu.par.province=tapply(revenus,fprov,mean)
•revenu.par.province
AG
14900
RG
15300
CL
14600
CT
15950
SR
TP
16200
18000
EN
19500
ME
PA
16033.33 15466.6
La fonction which()
• which(x, arr.ind = FALSE)
• x: un vecteur ou tableau logique
• arr.ind: logique est-ce que les indices du
tableau doivent être retournés lorsque x
est un tableau?
• Exemple: m = matrix(12:24,3,4) ;m
[,1] [,2] [,3] [,4]
[1,]
12
15
18
21
[2,]
13
16
19
22
[3,]
14
17
20
23
which(m %% 3 == 0)
[1] 1 4 7 10
which(m %% 3 == 0, arr.ind=TRUE)
row col
[1,]
1
1
[2,]
1
2
[3,]
1
3
[4,]
1
4