Chapitre 1 Introduction
R est un logiciel libre et gratuit principalement dédié aux analyses statistiques et aux représentations graphiques. Il est gratuit et librement distribué par le CRAN (Comprehensive R Archive Network) à l’adresse suivante : https://www.r-project.org.
L’installation varie d’un système d’exploitation à l’autre (Windows, Mac OS, Linux) mais elle est relativement simple, il suffit de suivre les instructions.
RStudio est une interface facilitant l’utilisation de R. Elle est également gratuite et librement distribuée à l’adresse https://www.rstudio.com.
L’interface RStudio est divisée en 4 fenêtres :
- Console où on peut entrer et exécuter des commandes (taper 1+2)
- Environnement, History où on peut visualiser les objets construits (taper a <- 1+2 dans la console)
- Files, Plots… où on peut visualiser les répertoires et fichiers de l’espace de travail, les graphiques, intaller des packages…
- R script où on conserve les lignes de commandes ainsi que les commentaires sur le travail effectué. Il faut penser à sauvegarder régulièrement ce fichier.
1.1 R Script
Il existe différentes façons de travailler sur RStudio. De façon classique, on peut
- ouvrir un script.
- entrer les commandes dans le script.
- regarder les sorties dans la console (en cliquant sur le bouton run).
- sauver le script.
1.2 Packages
Un package est une ensemble de programmes et fonctions R qui complètent les fonctions existantes par défaut dans le logiciel. Un package est généralement dédié à une méthode ou un champ d’application spécifique. Il existe plus de 18 000 packages disponibles sur le CRAN https://cran.r-project.org. On installe un package en
- utilisant le fonction install.packages dans la console. ou
- ou cliquant sur le bouton Packages.
Une fois le package installé sur la machine, on l’installe avec la fonction library :
Exécuter
Que se passe t-il ?
Installer et charger le package tidyverse et ré-executer le code précédent.
1.3 Markdown
markdown est un package qui permet de créer différents types de documents :
- rapports au format pdf ou rtf
- pages web html
- diaporama pour des présentations (html, beamer, PowerPoint…)
- applications web interactives
- …
qui comportent du code R.
1.3.1 Syntaxe
La syntaxe s’apprend assez facilement (il faut pratiquer), on pourra trouver un descriptif synthétique dans la cheatsheet dédiée à Rmarkdown. Par exemple :
Caractère en italique ou gras :
*italique*
et**gras**
donne italique et grasListes non ordonnées
produit
- item 1
- item 2
liste ordonnée :
produit
- item 1
- item 2
tableau :
renvoie
Col1 | Col2 | Col3 | |
---|---|---|---|
Row1 | 1 | 2 | 3 |
Row2 | 1 | 2 | 3 |
équation latex :
renvoie \[\int_a^b f(x)dx=1\]
1.3.2 Les chunks
Le code R doit être écrit dans des chunks. On peut insérer des chunks avec :
- la raccourci clavier Ctrl + Alt + I (OS X: Cmd + Option + I)
- la bouton Insert -> R
- en tapant :
Plusieurs options peuvent être spécifiés au chunk en fonction de ce que l’on souhaite voir dans le document, par exemple :
- echo :
TRUE
orFALSE
pour spécifier si on souhaite afficher le code ; - eval :
TRUE
orFALSE
pour spécifier si le code doit être évalusé ou non ; - results :
hide
si on ne veut pas voir la sortie du code.
On pourra trouver l’ensemble des options disponibles sur cette page : https://yihui.org/knitr/options/
Ouvrir un document mardown (File -> New File -> R Markdown).
Cliquer sur le bouton
Knit
et visualiser la sortie html.Obtenir une sortie pdf.
Modifier le document en créant une section Cosinus dans laquelle on tracera la fonction
cosinus
, on pourra utiliser le code suivant dans un chunk.Ajouter une section Sinus dans laquelle on tracera la fonction
sinus
.
1.3.3 Notebook
L’environnement notebook fonctionne exactement comme un document markdown mais permet de visualiser la sortie eu format html sans avoir à recompiler le document en entier. Cet environnement est donc souvent privilégié pendant la réalisation d’un projet en science des données. Pour créer un notebook, on peut passer par RStudio : File -> New File -> R Notebook ou simplement remplacer
par
dans l’entête d’un document markdown.
Transformer le document markdown de l’exercice précédent en notebook. On pourra visualier la sortie en cliquant sur Preview.
1.3.4 Diaporama R
Rstudio propose aussi différents environnements pour construire des diaporamas. On pourra utiliser le menu File -> New File -> R Markdown -> Presentation, puis sélectionner le format ioslides ou slidy. On utilisera la même syntaxe que pour les documents markdown. Les slides sont séparés par le symbole ##
et les codes R sont toujours insérés dans des chunks.
- Créer 2 diapositives :
- Titre: Cosinus où on tracera la fonction cosinus.
- Titre: Sinus où on tracera la fonction sinus.
- En modifiant les options des chunks modifier les diapositives de manière à
- ne pas voir le code R mais voir les graphiques
- voir uniquement le code R mais pas les graphiques.
1.3.5 Exemples de styles de documents markdown
Par défaut l’entête d’un document markdown est de la forme
Il existe un grand nombre d’options qui permettent d’améliorer le document final. On peut par exemple ajouter une table des matières avec
On peut également utiliser des styles prédéfinis en
changeant le thème, voir https://www.datadreaming.org/post/r-markdown-theme-gallery/
utilisant le package prettydoc (il faut l’installer), voir https://github.com/yixuan/prettydoc
utilisant le package rmdformats (à installer aussi), voir https://github.com/juba/rmdformats