L'application BaobARD vous permet de créer votre propre arbre de régression ou de classification à partir d'un simple fichier csv !
Si vous n'avez aucune idée de ce que peuvent être des arbres de régression ou de classification ou pourquoi les utiliser, un rappel très succint sera effectué juste ci dessous, mais la présentation stockée ici sur github vous permettra d'appréhender ce que sont et permettent les arbres de décisison. Si vous souhaitez savoir aller plus loin que ce que permet cette application et réaliser vous même sur R vos arbres de décision un guide est en cours de construction sur le site web OUVRIR .
Outre cette première page, cette application contient 2 autres onglets.
Le premier vous permet de charger et visualiser les données que vous souhaitez analyser. Vous pouvez importer uniquement des fichiers au format csv.
Le deuxième onglet vous permettra de construire et visualiser un arbre de décision. Il vous reviendra de déterminer la variable que vous souhaitez prédire et les variables explicatives. Une fois satisfait vous pourrez télécharger votre visualisation aux formats png, pdf ou svg.
Parce que vous voulez enfin pouvoir faire plus qu'une corrélation ! Parce que la liste des pré-requis pour faire une régression ou tout autre test statistique cherchant à étudier la causalité est plus longue que le bras ! Et surtout parce que jamais vos données n'ont pu remplir une seule de ces conditions !
L'arbre de décision est un outil tout terrain parfaitement adapté aux données en SHS.
C'est un outil statistique d’exploration des données et de prédiction. Il peut servir à expliquer aussi bien une variable qualitative (on parle alors d’arbre de classification) qu'une variable quantitative (arbre de régression). Par rapport à d’autres méthodes classiques (analyse factorielle, régression, réseau de neurones...) l’arbre de décision possède de nombreux avantages :
- les données d’entrée peuvent être « mixtes », c’est-à-dire qu’un même arbre peut utiliser simultanément des variables prédictives qualitatives, ordinales et continues ;
- la gestion des données manquantes est particulièrement efficace ;
- la construction d’un arbre est rapide et peu gourmande en ressources ;
- l'arbre de décision est relativement simple à interpréter.
Plus un certain nombre d'autres avantages non négligeable ! Je vous invite une fois de plus à vous rendre sur la paghe dédiée sur OUVRIR .
Dans l'éventualité où vous utiliseriez cette application pour créer un arbre de décision et que vous le publiez, vous pouvez citer cette application comme ceci :
Le Campion G. Baobard: un outil de visualisation et d'exploration de vos données à l'aide d'un arbre de décision. Pôle ARD UMR 5319 UMR Passages. 2019.