TP1 Outils informatique Commencer par les commandes demo

Transcription

TP1 Outils informatique Commencer par les commandes demo
TP1
Outils informatique
Commencer par les commandes demo(image); demo(graphics); demo(persp);
Créer sur votre bureau un dossier intitulé R avec 3 sous-dossiers intitulés Donnees Scripts
Rapports.
1. Génération de suite numérique ou de caractères
a. Créez quelques variables et vecteurs (fonction c()), numériques, chaines de caractères et
logique, en utilisant des affectations simples et des opérations arithmétiques et logiques.
b. Observez l’ensemble des objets disponibles dans la session (fonction objects(), rm() )
c. Utilisez les fonctions seq(), rep(), c(), et paste(), pour générer des vecteurs de différents
types, vous utiliserez les pages d'aide pour obtenir des informations sur ces fonctions.
(?seq())
d. générer un vecteur de chaines de caractères nommé Individus contenant les chaines
suivantes :
individu 1 , individu 2,...,individu 152
on utilisera les fonctions paste et :
2. Etude de l'indice de masse corporelle
Un échantillon de dossiers d'enfants a été saisi. Ce sont des enfants vus lors d'une visite en
première section de maternelle en 1996-1997, dans des écoles de Bordeaux. L'échantillon
présenté ici est constitué de 10 enfants agés de 3 ou 4 ans.
Les données disponibles pour chaque enfant sont:
● le sexe G ou F
● le fait que leur école soit située en ZEP ou pas: O pour oui , N pour Non.
● L'age en années et en mois à la date de la visite (deux variables, une pour le nombre
d'années, une pour le nombre de mois).
● Le poids en kilos arrondis à 100g prés.
● La taille en cm arrondie à 0,5 cm prés
Prénom Erika Célia Eric
Eve
Paul
Jean
Adam Louis Jules Léo
Sexe
F
F
G
F
G
G
G
G
G
G
ZEP
O
O
O
O
N
O
N
O
O
O
Poids 16
14
13,5
15,4
16,5
16
17
14,8
17
16,7
An
3
3
3
4
3
4
3
3
4
3
Mois
5
10
5
0
8
0
11
9
1
3
Taille 100
97,0
95,5
101.0
100,0 98,5
103
98
101,5 100.0
En statistiques, il est très important de connaître le type des variables étudiées: quantitatives,
qualitatives, ordinales...Préciser ce qu'il en est dans le cas présent.
1. Enregistrer les données de chacunes de variables ci-dessus dans des vecteurs que vous
nommerez: Individus, Sexe, Zep, Taille, Poids.
2. Calculer la moyenne des variables lorsque cela est possible.(mean())
3. Utiliser la fonction summary() pour obtenir un résumé statistique des vecteurs que
vous générez. Ce résumé dépend de la nature du vecteur. Observer.
4. Calculer l'IMC des individus et regroupez les valeurs obtenues dans un vecteur que
vous nommerez IMC (l'IMC est le quotient poids(en kg)/taille^2(en m)).
5. Regroupez ces variables dans la structure R qui vous paraît la plus adaptée.
6. Utilisez l'aide en ligne de R afin d'obtenir des informations sur la fonction plot().
7. Tracer le nuage de points du poids en fonction de la taille. Donner un titre à votre
graphe, annotez les axes (paramètres de la fonction plot())
8. Importer dans votre dossier Donnees les jeux de donnees
Jeux0 à l'adresse http://www.lumimath.univ-mrs.fr/~broglio/l2/donnees/data.html.
9.
Importer le fichier .txt ou le fichier .ods sous R par la commande:
D=read.table(file.choose(),sep="\t",header=TRUE,dec=",");D ;
10. Quelles sont les informations obtenues par dim(D)?colnames(D) ? rownames(D) ?
Quel est le type et le mode de l'objet colnames(D)
11. Modifier les noms de colonne de votre tableau par la commande
colnames(D)=Individus (Individus est le vecteur créé précedemment)
12. Utiliser la fonction summary() pour obtenir un résumé statistique des différentes
colonnes du tableau. Ces colonnes se nomment D$SEXE,...D$taille.
13. Faire la même chose en remplaçant la fonction summary par la fonction boxplot.
Qu'obtenez-vous ?
14. Qu'obtient-on par les commandes summary(D), boxplot(D) ?