L`actualité R4ciam L`actualitéR ciam - Informatique de MIA

Transcription

L`actualité R4ciam L`actualitéR ciam - Informatique de MIA
J UILLET 2015, N O 5
L’actualité R4ciam
maic4R étilautca’L
Sur le site r4stats.com, Robert A. M UENCHEN, auteur de 2 ouvrages
intitulés R for SAS and SPSS Users et R for Stata Users, propose
un article très intéressant sur les différentes façon de mesurer la
popularité d’un logiciel d’analyse (dont R).
Dans cet article, régulièrement mis à jour, il liste plus d’une dizaine
de façons de calculer cette popularité avec leurs avantages et leurs
inconvénients.
Parmi les plus utiles, on trouve par ordre décroissant d’intérêt,
(1) le dépouillement des offres d’emploi (Job Advertisements), (2)
la lecture des articles scientifiques (Scholarly Articles) et (3) des
ouvrages (Books), (4) la popularité (PageRank) des sites officiels des
logiciels (Website Popularity), (5) le nombre des blogs consacrés
en tout ou partie au logiciel (Blogs), . . .
Repris du site r4stats.com
R apparait en 5e position dans le dépouillement des offres d’emploi
avec ≈ 3000 occurrences, pour ≈ 5800 et ≈ 6500 pour SAS et Java
respectivement ; il se place au 3e rang, des logiciels cités dans les
articles scientifiques derrière 2 logiciels commerciaux : SPSS et
SAS ; enfin, il apparait en seconde position dans le nombre de liens
pointant vers les sites officiels des différents logiciels d’analyse.
Agenda : annonces
R4ciam : nouvelles fiches
• Enregistrer une sortie R dans un fichier (ici)
• Les événements souris et clavier dans une fenêtre graphique (ici)
• Vérification des données avec testthat (ici)
R4ciam : nouveaux tutoriels
• Déterminer la taille des échantillons, notion sous-jacente :
puissance d’un test (ici)
• Utilisation de Git sous RStudio (ici)
• Une nouvelle version de R est sortie le 18 juin 2015. Il s’agit
de la version 3.2.1 appelée World-Famous Astronaut.
• Une nouvelle version de RStudio est sortie le 16 juin 2015. Il
s’agit de la version 0.99.446 (2015-06-16).
• Une nouvelle mailing list pour les développeurs de packages
r-package-devel
Agenda : séminaires, conférences
• « R pour le calcul » : R avancé et performances : formation
organisée par le Groupe Calcul, du 4 au 9 octobre à Aussois
(informations)
Agenda : ouvrages, publications
• Deux nouveaux volumes du Journal of Statistical Software
sont sortis (volume 64, volume 65).
• Programmation et Analyse Statistique avec R, Christian PA ROISSIN , Ellipses Marketing
Focus : une task view
Focus : un site
• Le site de Noam R OSS (D-RUG ) propose plusieurs tutoriels
vidéo sur l’utilisation de R
• Comment faire des animations dans R
Focus : une fonction
Sous R, la liste des caractères utilisables pour nommer les objets est restreinte aux lettres [a-z], [A-Z], aux chiffres [0-9] et aux
caractères « . » et « _ ». De plus, le nom ne doit pas commencer
par un chiffre et doit être différent de TRUE, FALSE, NA, NULL.
La fonction make.name() permet de vérifier si un nom est
conforme à ces règles. Dans le cas contraire, elle indique un
nom valide.
Ex <- c("essai", "N°", "date 1", "Temp-Base", "1jour",
+
".initial", "1jour", "PoidsFinal", "FALSE")
> make.names(Ex, unique=TRUE, allow_=FALSE)
[1] "essai"
"N."
"date.1"
"Temp.Base"
[5] "X1jour"
".initial"
"X1jour.1"
"PoidsFinal"
[9] "FALSE."
Les Task views sont des compilations disponibles sur le site du
CRAN, regroupant par grands thèmes/disciplines, les packages
R jugés les plus pertinents pour le thème ou la discipline (voir la
fiche Les Task views et le package ctv)
La task view « Robust » maintenue par Martin M AECHLER, recense les packages R autour des statistiques robustes/résistantes.
Elle présente une cinquantaine de packages.
install.packages("ctv")
library("ctv")
install.views("Robust")
# update.views("Robust")
Détente : un script amusant
Sur le blog mages’blog, on peut trouver un script R reproduisant le tableau Moving Squares de l’artiste d’Op Art Bridget
R ILEY.
Focus : un package
sivipm (Sensitivity Indices with Dependent Inputs) est un
nouveau package mis à disposition par l’unité MaIAGE de l’INRA.
Il calcule les indices de sensibilité totaux et individuels pour
des entrées continues corrélées ou dépendantes, avec présence
éventuelle de variables indicatrices de variables qualitatives. Ce
package est basé sur une méthode proposée par J.P. G AUCHI, impliquant les VIP (Variable Importance in the Projection) proposés
par S. W OLD dans la régression PLS.
Les composantes significatives sont déterminées par deux
règles au choix : la règle de S. Wold (comme programmée dans le
logiciel SIMCAP) et le test de Lazraq & Cléroux. Les intervalles de
confiance boostrap des indices de sensibilité totaux sont donnés.
# Rédaction
> paste(sample(auteurs), collapse=", ")
[1] "F. Dessaint, A. Bouvier, C. Chabanet"
;-) fortunes::fortune()
I recently read the small print on the academic license our site has for SAS. You have to:
1) inform SAS of any taught courses that use SAS, 2) inform SAS of any research projects using SAS,
3) allow SAS to refer to your institution as a SAS user, 4) allow SAS to review your taught courses,
5) ensure your courses are taught using qualified personnel, 6) give SAS your first-born male offspring.
I spoke to our site’s licensing supremos and they say they’ve never heard of anyone complying with 1
or 2. Point 4 sounds like petty fiddling in our educational business, and point 5 left ’qualified’
undefined. Point 6 doesn’t bother me since I don’t have kids.
-- Barry Rowlingson (February 2008)
Pour nous joindre, proposer une fiche, s’inscrire à la liste de diffusion, . . . une seule adresse : ciam.inra.fr/r4ciam/contact