Méthodes par arbres
Présentation
Ce tutoriel présente quelques exercices d’application sur les méthodes par arbres. On pourra trouver
- les supports de cours associés à ce tutoriel ainsi que les données utilisées à l’adresse suivante https://lrouviere.github.io/page_perso/grande_dim.html ;
- le tutoriel sans les corrections à l’url https://lrouviere.github.io/TUTO_ARBRES/
- le tutoriel avec les corrigés (à certains moment) à l’url https://lrouviere.github.io/TUTO_ARBRES/correction.
Il est recommandé d’utiliser mozilla firefox pour lire le tutoriel.
Des connaissances de base en R et en statistique (modèles de régression) sont nécessaires. Le tutoriel se structure en 4 parties :
- Arbres : construction d’arbres et élagages avec
rpart
- Forêts aléatoires : l’algorithme et le choix des paramètres avec
ranger
etrandomForest
- Gradient boosting: l’algorithme et le choix des paramètres avec
gbm
etxgboost