↑↑↑关注后"星标"炼丹笔记
炼丹笔记·干货
作者:杰少@kaggle竞赛宝典
简介
目前已经存在非常多可视化树模型的策略,此处我们给出另外一种最新的树模型可视化工具包--pybaobabdt,该工具包提供了可视化分析方法的双重示例。可以通过交互和可视化来增强机器学习方法。
pybaobabdt的名字由来来源于:Adansonia digitata或非洲猴面包树African baobab,因为它与树的结构惊人地相似。
代码
- 代码摘自:https://medium.com/towards-data-science/visualizing-decision-trees-with-pybaobabdt-f8eb5b3d0d17
# pip install pybaobabdt
# pip install pygraphviz
from sklearn.tree import DecisionTreeClassifier
import pandas as pd
import pybaobabdt
df = pd.read_csv('./data/penguins_classification.csv')
y = list(df['Species'])
features = list(df.columns)
target = df['Species']
features.remove('Species')
X = df.loc[:, features]
clf = DecisionTreeClassifier().fit(X,y)
代码语言:javascript复制ax = pybaobabdt.drawTree(clf, size=10, dpi=300, features=features, ratio=0.8,colormap='Set1')
除了上述的基本功能之外,pybaobabdt还支持很多自定义的功能,例如Colormaps等。
小结
pybaobabdt软件包提供了一个新的可视化视角。它包含了在可视化工具包所不具有的功能,通过有意义的可视化帮助用户理解和解释树。如果有希望这类树的可视化的朋友可以尝试一下。
参考文献
- Visualizing Decision Trees with Pybaobabdt
- https://gitlab.tue.nl/20040367/pybaobab/-/tree/main