问题提出:
决策树是一种优秀的机器学习算法,具有很好模型可解释性,有着广泛地应用。如何对决策树模型的结果做可视化分析,以便于更多人理解决策树做决策的机理?
解决方案:
1 安装graphviz
2 使用Python的pandas, scikit-learn, pydotplus
参考代码如下:
1)数据导入
2)从数据集中提取因变量和自变量
3)数据集划分和模型构建
4) 模型性能评估
5) 决策树结果可视化分析
方式一:图形展示
方式二:保存为PDF格式
思考题:
1 如何利用决策树模型对变量的重要性作分析?
2 如何调整决策树模型的超参数?