Cours 4 Compléments
Transcription
Cours 4 Compléments
Cours 4 Compléments Quelques résumés statistiques Les résumés numériques pour calculer des statistiques sur un échantillon numérique ● Moyenne arithmétique mean() ● Médiane d'un échantillon median() ● Minimum, maximum min(), max() ● Calcul des percentiles quantile() ● Variance var() ● Écart-type sd() ● Covariance, coefficient de corrélation cov(),cor() ● Résumé statistique summary() exemple x=sample(1:50,20) > x [1] 33 3 49 23 38 29 21 27 28 47 42 19 5 24 10 34 41 43 1 8 > summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 16.75 27.50 26.25 38.75 49.00 Les résumés graphiques ● Pour des données discrètes ou catégorielles Diagramme en batons: barplot() Cette fonction prend comme argument un objet résultat de la fonction table() ● pour des données continues, hist() hist(x,breaks= « Sturges »,prob=FALSE) ● ● X un vecteur de valeurs pour lequel on souhaite un histogramme breaks:soit -un vecteur chaine de caractère donnant un algorithme pour calculer le nombre d'intervalles -un nombre donnant le nombre d'intervalles ● prob=FALSE:effectifs ● prob=TRUE: fréquences Eviter d ’écrire des boucles Eviter d ’écrire des boucles:1 avec les fonctions apply() lapply()sapply() • apply(X, MARGIN, FUNC, ...) retourne un vecteur de la taille appropriée, où • X: tableau • Margin =1 pour les lignes, 2 pour les colonnes • Func: fonction '+', '%*%‘, mean, sum,... • lapply sapply() même fonction pour les listes et les vecteurs Eviter d ’écrire des boucles (2) • Exemple 1 n=10 p=0.2 x=0:n y=choose(n,x)*p^x*(1-p)^(nx) #ou bien y=dbinom(x,n,p) plot(x,y,type="h",lwd=10) • Exemple 2 prod(1:8); 40320 identique à factorial(8) Un exemple d'utilisation du type factor Le type factor:Un exemple • Un facteur est un objet vecteur qui peut être utilisé pour spécifier une classification discrète des composants d’un autre vecteur de même longueur • Facteurs non ordonné:variable qualitative • Facteurs ordonnés:variable ordonnée qualitative • provenance=c("PA","PA","AG","RG","ME","CT", "CT","SR","TP","EN","CL","ME","PA","AG","RG ","ME","CT","CT","SR","TP","EN") • length(provenance) • [1] 21 • • fprov=factor(provenance) ;fprov [1] PA PA AG RG ME CT CT SR TP EN CL ME PA AG RG ME CT CT SR TP EN • Levels: AG CL CT EN ME PA RG SR TP • levels(fprov) • [1] "AG" "CL" "CT" "EN" "ME" "PA" "RG" "SR" "TP" •revenus=c(13000,14900,14000,16100,14500,16600,159 00,15400,17000,19000,14600,17000,18500,15800,14500 ,16600,15900,15400,17000,19000,20000) •revenu.par.province=tapply(revenus,fprov,mean) •revenu.par.province AG 14900 RG 15300 CL 14600 CT 15950 SR TP 16200 18000 EN 19500 ME PA 16033.33 15466.6 La fonction which() • which(x, arr.ind = FALSE) • x: un vecteur ou tableau logique • arr.ind: logique est-ce que les indices du tableau doivent être retournés lorsque x est un tableau? • Exemple: m = matrix(12:24,3,4) ;m [,1] [,2] [,3] [,4] [1,] 12 15 18 21 [2,] 13 16 19 22 [3,] 14 17 20 23 which(m %% 3 == 0) [1] 1 4 7 10 which(m %% 3 == 0, arr.ind=TRUE) row col [1,] 1 1 [2,] 1 2 [3,] 1 3 [4,] 1 4