L`actualité R4ciam L`actualitéR ciam - Informatique de MIA
Transcription
L`actualité R4ciam L`actualitéR ciam - Informatique de MIA
J UILLET 2015, N O 5 L’actualité R4ciam maic4R étilautca’L Sur le site r4stats.com, Robert A. M UENCHEN, auteur de 2 ouvrages intitulés R for SAS and SPSS Users et R for Stata Users, propose un article très intéressant sur les différentes façon de mesurer la popularité d’un logiciel d’analyse (dont R). Dans cet article, régulièrement mis à jour, il liste plus d’une dizaine de façons de calculer cette popularité avec leurs avantages et leurs inconvénients. Parmi les plus utiles, on trouve par ordre décroissant d’intérêt, (1) le dépouillement des offres d’emploi (Job Advertisements), (2) la lecture des articles scientifiques (Scholarly Articles) et (3) des ouvrages (Books), (4) la popularité (PageRank) des sites officiels des logiciels (Website Popularity), (5) le nombre des blogs consacrés en tout ou partie au logiciel (Blogs), . . . Repris du site r4stats.com R apparait en 5e position dans le dépouillement des offres d’emploi avec ≈ 3000 occurrences, pour ≈ 5800 et ≈ 6500 pour SAS et Java respectivement ; il se place au 3e rang, des logiciels cités dans les articles scientifiques derrière 2 logiciels commerciaux : SPSS et SAS ; enfin, il apparait en seconde position dans le nombre de liens pointant vers les sites officiels des différents logiciels d’analyse. Agenda : annonces R4ciam : nouvelles fiches • Enregistrer une sortie R dans un fichier (ici) • Les événements souris et clavier dans une fenêtre graphique (ici) • Vérification des données avec testthat (ici) R4ciam : nouveaux tutoriels • Déterminer la taille des échantillons, notion sous-jacente : puissance d’un test (ici) • Utilisation de Git sous RStudio (ici) • Une nouvelle version de R est sortie le 18 juin 2015. Il s’agit de la version 3.2.1 appelée World-Famous Astronaut. • Une nouvelle version de RStudio est sortie le 16 juin 2015. Il s’agit de la version 0.99.446 (2015-06-16). • Une nouvelle mailing list pour les développeurs de packages r-package-devel Agenda : séminaires, conférences • « R pour le calcul » : R avancé et performances : formation organisée par le Groupe Calcul, du 4 au 9 octobre à Aussois (informations) Agenda : ouvrages, publications • Deux nouveaux volumes du Journal of Statistical Software sont sortis (volume 64, volume 65). • Programmation et Analyse Statistique avec R, Christian PA ROISSIN , Ellipses Marketing Focus : une task view Focus : un site • Le site de Noam R OSS (D-RUG ) propose plusieurs tutoriels vidéo sur l’utilisation de R • Comment faire des animations dans R Focus : une fonction Sous R, la liste des caractères utilisables pour nommer les objets est restreinte aux lettres [a-z], [A-Z], aux chiffres [0-9] et aux caractères « . » et « _ ». De plus, le nom ne doit pas commencer par un chiffre et doit être différent de TRUE, FALSE, NA, NULL. La fonction make.name() permet de vérifier si un nom est conforme à ces règles. Dans le cas contraire, elle indique un nom valide. Ex <- c("essai", "N°", "date 1", "Temp-Base", "1jour", + ".initial", "1jour", "PoidsFinal", "FALSE") > make.names(Ex, unique=TRUE, allow_=FALSE) [1] "essai" "N." "date.1" "Temp.Base" [5] "X1jour" ".initial" "X1jour.1" "PoidsFinal" [9] "FALSE." Les Task views sont des compilations disponibles sur le site du CRAN, regroupant par grands thèmes/disciplines, les packages R jugés les plus pertinents pour le thème ou la discipline (voir la fiche Les Task views et le package ctv) La task view « Robust » maintenue par Martin M AECHLER, recense les packages R autour des statistiques robustes/résistantes. Elle présente une cinquantaine de packages. install.packages("ctv") library("ctv") install.views("Robust") # update.views("Robust") Détente : un script amusant Sur le blog mages’blog, on peut trouver un script R reproduisant le tableau Moving Squares de l’artiste d’Op Art Bridget R ILEY. Focus : un package sivipm (Sensitivity Indices with Dependent Inputs) est un nouveau package mis à disposition par l’unité MaIAGE de l’INRA. Il calcule les indices de sensibilité totaux et individuels pour des entrées continues corrélées ou dépendantes, avec présence éventuelle de variables indicatrices de variables qualitatives. Ce package est basé sur une méthode proposée par J.P. G AUCHI, impliquant les VIP (Variable Importance in the Projection) proposés par S. W OLD dans la régression PLS. Les composantes significatives sont déterminées par deux règles au choix : la règle de S. Wold (comme programmée dans le logiciel SIMCAP) et le test de Lazraq & Cléroux. Les intervalles de confiance boostrap des indices de sensibilité totaux sont donnés. # Rédaction > paste(sample(auteurs), collapse=", ") [1] "F. Dessaint, A. Bouvier, C. Chabanet" ;-) fortunes::fortune() I recently read the small print on the academic license our site has for SAS. You have to: 1) inform SAS of any taught courses that use SAS, 2) inform SAS of any research projects using SAS, 3) allow SAS to refer to your institution as a SAS user, 4) allow SAS to review your taught courses, 5) ensure your courses are taught using qualified personnel, 6) give SAS your first-born male offspring. I spoke to our site’s licensing supremos and they say they’ve never heard of anyone complying with 1 or 2. Point 4 sounds like petty fiddling in our educational business, and point 5 left ’qualified’ undefined. Point 6 doesn’t bother me since I don’t have kids. -- Barry Rowlingson (February 2008) Pour nous joindre, proposer une fiche, s’inscrire à la liste de diffusion, . . . une seule adresse : ciam.inra.fr/r4ciam/contact