TP1 Outils informatique Commencer par les commandes demo
Transcription
TP1 Outils informatique Commencer par les commandes demo
TP1 Outils informatique Commencer par les commandes demo(image); demo(graphics); demo(persp); Créer sur votre bureau un dossier intitulé R avec 3 sous-dossiers intitulés Donnees Scripts Rapports. 1. Génération de suite numérique ou de caractères a. Créez quelques variables et vecteurs (fonction c()), numériques, chaines de caractères et logique, en utilisant des affectations simples et des opérations arithmétiques et logiques. b. Observez l’ensemble des objets disponibles dans la session (fonction objects(), rm() ) c. Utilisez les fonctions seq(), rep(), c(), et paste(), pour générer des vecteurs de différents types, vous utiliserez les pages d'aide pour obtenir des informations sur ces fonctions. (?seq()) d. générer un vecteur de chaines de caractères nommé Individus contenant les chaines suivantes : individu 1 , individu 2,...,individu 152 on utilisera les fonctions paste et : 2. Etude de l'indice de masse corporelle Un échantillon de dossiers d'enfants a été saisi. Ce sont des enfants vus lors d'une visite en première section de maternelle en 1996-1997, dans des écoles de Bordeaux. L'échantillon présenté ici est constitué de 10 enfants agés de 3 ou 4 ans. Les données disponibles pour chaque enfant sont: ● le sexe G ou F ● le fait que leur école soit située en ZEP ou pas: O pour oui , N pour Non. ● L'age en années et en mois à la date de la visite (deux variables, une pour le nombre d'années, une pour le nombre de mois). ● Le poids en kilos arrondis à 100g prés. ● La taille en cm arrondie à 0,5 cm prés Prénom Erika Célia Eric Eve Paul Jean Adam Louis Jules Léo Sexe F F G F G G G G G G ZEP O O O O N O N O O O Poids 16 14 13,5 15,4 16,5 16 17 14,8 17 16,7 An 3 3 3 4 3 4 3 3 4 3 Mois 5 10 5 0 8 0 11 9 1 3 Taille 100 97,0 95,5 101.0 100,0 98,5 103 98 101,5 100.0 En statistiques, il est très important de connaître le type des variables étudiées: quantitatives, qualitatives, ordinales...Préciser ce qu'il en est dans le cas présent. 1. Enregistrer les données de chacunes de variables ci-dessus dans des vecteurs que vous nommerez: Individus, Sexe, Zep, Taille, Poids. 2. Calculer la moyenne des variables lorsque cela est possible.(mean()) 3. Utiliser la fonction summary() pour obtenir un résumé statistique des vecteurs que vous générez. Ce résumé dépend de la nature du vecteur. Observer. 4. Calculer l'IMC des individus et regroupez les valeurs obtenues dans un vecteur que vous nommerez IMC (l'IMC est le quotient poids(en kg)/taille^2(en m)). 5. Regroupez ces variables dans la structure R qui vous paraît la plus adaptée. 6. Utilisez l'aide en ligne de R afin d'obtenir des informations sur la fonction plot(). 7. Tracer le nuage de points du poids en fonction de la taille. Donner un titre à votre graphe, annotez les axes (paramètres de la fonction plot()) 8. Importer dans votre dossier Donnees les jeux de donnees Jeux0 à l'adresse http://www.lumimath.univ-mrs.fr/~broglio/l2/donnees/data.html. 9. Importer le fichier .txt ou le fichier .ods sous R par la commande: D=read.table(file.choose(),sep="\t",header=TRUE,dec=",");D ; 10. Quelles sont les informations obtenues par dim(D)?colnames(D) ? rownames(D) ? Quel est le type et le mode de l'objet colnames(D) 11. Modifier les noms de colonne de votre tableau par la commande colnames(D)=Individus (Individus est le vecteur créé précedemment) 12. Utiliser la fonction summary() pour obtenir un résumé statistique des différentes colonnes du tableau. Ces colonnes se nomment D$SEXE,...D$taille. 13. Faire la même chose en remplaçant la fonction summary par la fonction boxplot. Qu'obtenez-vous ? 14. Qu'obtient-on par les commandes summary(D), boxplot(D) ?