scikit-learn决策树算法类库使用小结

发布时间：2016年11月24日作者：文章转自网络，版权归原作者所有，反馈可立刻删除

之前对决策树的算法原理做了总结，包括决策树算法原理(上)和决策树算法原理(下)。今天就从实践的角度来介绍决策树算法，主要是讲解使用scikit-learn来跑决策树算法，结果的可视化以及一些参数调参的关键点。

1. scikit-learn决策树算法类库介绍

scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法，既可以做分类，又可以做回归。分类决策树的类对应的是DecisionTreeClassifier，而回归决策树的类对应的是DecisionTreeRegressor。两者的参数定义几乎完全相同，但是意义不全相同。下面就对DecisionTreeClassifier和DecisionTreeRegressor的重要参数做一个总结，重点比较两者参数使用的不同点和调参的注意点。

2. DecisionTreeClassifier和DecisionTreeClassifier 重要参数调参注意点

为了便于比较，这里我们用表格的形式对DecisionTreeClassifier和DecisionTreeRegressor重要参数要点做一个比较。

参数	DecisionTreeClassifier	DecisionTreeRegressor
特征选择标准criterion	可以使用"gini"或者"entropy"，前者代表基尼系数，后者代表信息增益。一般说使用默认的基尼系数"gini"就可以了，即CART算法。除非你更喜欢类似ID3, C4.5的最优特征选择方法。	可以使用"mse"或者"mae"，前者是均方差，后者是和均值之差的绝对值之和。推荐使用默认的"mse"。一般来说"mse"比"mae"更加精确。除非你想比较二个参数的效果的不同之处。
网友评论更多精彩分享学习是年轻人改变自己的最好方式栏目导航：如何学习软件关于万码学堂关注点旗下网站：程序猿编程派万码学堂官网青岛青软职业培训学校万码学堂（办学许可证编号：人社民3702023080012号）鲁ICP备09077726号 qingruanit.net 青岛市市南区南京路122号B1栋3层咨询电话0532-85025005

分类导航

scikit-learn决策树算法类库使用小结

1. scikit-learn决策树算法类库介绍

2. DecisionTreeClassifier和DecisionTreeClassifier 重要参数调参注意点

网友评论

更多精彩分享