今天的内容介绍如何将决策树模型画出来。
进入实战部分!
首先安装所需的R包,并且载入:
install.packages("rpart")
install.packages("rpart.plot")library(rpart)
library(rpart.plot)
R包get!
下一步,使用mtcars数据集建立一个决策树模型,其中的mpg作为因变量,代码如下:
tree <- rpart(mpg ~ hp + wt + am, data = mtcars)
将上述模型tree进行作图:
rpart.plot(tree)
以右下角的方框内容为例,一个方框指代一个节点,其中的数字29指的是此决策树给出的预测值mpg=29,样本占总数的22%。
方框的颜色(这里为蓝色,可修改)与mpg的值成正比,即值越大,颜色越深。
可以通过代码改变决策树的展示风格,一共有6种风格可供选择,代码如下:
par(mfrow = c(3, 2))
rpart.plot(tree, type = 0)
rpart.plot(tree, type = 1)
rpart.plot(tree, type = 2) #默认
rpart.plot(tree, type = 3)
rpart.plot(tree, type = 4)
rpart.plot(tree, type = 5)
par(mfrow = c(1, 1))
大家可以根据个人的喜好进行选择。
还可以添加一些额外的信息,比如每个节点的样本量,代码如下:
rpart.plot(tree, extra = 101) # 添加样本量
也可以调整小数点保留的位数:
rpart.plot(tree, digits = 5)
最后,调节上述节点的颜色为橘红色,代码如下:
rpart.plot(tree, box.palette = "Oranges")
关于其它更多修饰,可以询问R的帮助系统:?rpart.plot
好啦,今天的内容就到这里。如果有帮助,记得分享给需要的人
!
参考文献
https://cran.r-project.org/web/packages/rpart.plot/