Bienvenue sur l'application BaobARD une appli qui vous permet de créer votre propre Arbre de décision !

L'application BaobARD vous permet de créer votre propre arbre de régression ou de classification à partir d'un simple fichier csv !

Si vous n'avez aucune idée de ce que peuvent être des arbres de régression ou de classification ou pourquoi les utiliser, un rappel très succint sera effectué juste ci dessous, mais la présentation stockée ici sur github vous permettra d'appréhender ce que sont et permettent les arbres de décisison. Si vous souhaitez savoir aller plus loin que ce que permet cette application et réaliser vous même sur R vos arbres de décision un guide est en cours de construction sur le site web OUVRIR .

Outre cette première page, cette application contient 2 autres onglets.

Le premier vous permet de charger et visualiser les données que vous souhaitez analyser. Vous pouvez importer uniquement des fichiers au format csv.

Le deuxième onglet vous permettra de construire et visualiser un arbre de décision. Il vous reviendra de déterminer la variable que vous souhaitez prédire et les variables explicatives. Une fois satisfait vous pourrez télécharger votre visualisation aux formats png, pdf ou svg.


Pourquoi un arbre de décision ?

Parce que vous voulez enfin pouvoir faire plus qu'une corrélation ! Parce que la liste des pré-requis pour faire une régression ou tout autre test statistique cherchant à étudier la causalité est plus longue que le bras ! Et surtout parce que jamais vos données n'ont pu remplir une seule de ces conditions !

L'arbre de décision est un outil tout terrain parfaitement adapté aux données en SHS.

C'est un outil statistique d’exploration des données et de prédiction. Il peut servir à expliquer aussi bien une variable qualitative (on parle alors d’arbre de classification) qu'une variable quantitative (arbre de régression). Par rapport à d’autres méthodes classiques (analyse factorielle, régression, réseau de neurones...) l’arbre de décision possède de nombreux avantages :

- les données d’entrée peuvent être « mixtes », c’est-à-dire qu’un même arbre peut utiliser simultanément des variables prédictives qualitatives, ordinales et continues ;

- la gestion des données manquantes est particulièrement efficace ;

- la construction d’un arbre est rapide et peu gourmande en ressources ;

- l'arbre de décision est relativement simple à interpréter.

Plus un certain nombre d'autres avantages non négligeable ! Je vous invite une fois de plus à vous rendre sur la paghe dédiée sur OUVRIR .


Citation

Dans l'éventualité où vous utiliseriez cette application pour créer un arbre de décision et que vous le publiez, vous pouvez citer cette application comme ceci :

Le Campion G. Baobard: un outil de visualisation et d'exploration de vos données à l'aide d'un arbre de décision. Pôle ARD UMR 5319 UMR Passages. 2019.

Affichage de l'arbre

Télécharger Arbre
Affichage du cp optimal, c'est à dire le niveau d'élagage idéal !

                  

Affichage de l'arbre élagué

Télécharger Arbre

Vous trouverez ici les règles de décision et construction de l’arbre élagué


                    
Chaque ligne correspond à un noeud ou à une feuille de l’arbre. On commence par la racine (1) qui contient les n individus de notre population.
A l’étape suivante l’arbre découpe la population en fonction de la variable déterminée et créé les noeuds 2) et 3) et ainsi de suite jusqu'à arriver aux feuilles terminales.