有没有办法在scikit-learn中打印经过训练的决策树?我想为自己的论文训练决策树,并希望将论文的图片放入论文中。那可能吗?
有一种方法可以导出为graph_viz格式:http
://scikit-
learn.org/stable/modules/generation/sklearn.tree.export_graphviz.html
因此,从在线文档中:
>>> from sklearn.datasets import load_iris
>>> from sklearn import tree
>>>
>>> clf = tree.DecisionTreeClassifier()
>>> iris = load_iris()
>>>
>>> clf = clf.fit(iris.data, iris.target)
>>> tree.export_graphviz(clf,
... out_file='tree.dot')
然后,您可以使用graph viz加载此文件,或者如果您已安装pydot,则可以直接进行以下操作:http ://scikit-
learn.org/stable/modules/tree.html
>>> from sklearn.externals.six import StringIO
>>> import pydot
>>> dot_data = StringIO()
>>> tree.export_graphviz(clf, out_file=dot_data)
>>> graph = pydot.graph_from_dot_data(dot_data.getvalue())
>>> graph.write_pdf("iris.pdf")
将产生一个svg,在此处无法显示,因此您必须点击以下链接:http : //scikit-
learn.org/stable/_images/iris.svg
更新资料
自从我第一次回答这个问题以来,似乎行为有所变化,现在返回a list
,因此您将收到此错误:
AttributeError: 'list' object has no attribute 'write_pdf'
首先,当您看到此内容时,仅打印对象并检查该对象是值得的,最有可能的是第一个对象:
graph[0].write_pdf("iris.pdf")
感谢@NickBraunagel的评论
问题内容: 我正在尝试在Python中使用scikit-learn设计一个简单的决策树(我在Windows OS上将Anaconda的Ipython Notebook与Python 2.7.3结合使用),并将其可视化如下: 但是,出现以下错误: 我使用以下博客文章作为参考:Blogpost链接 以下stackoverflow问题似乎也不适合我:问题 有人可以帮助我如何在scikit-learn中可
问题内容: 我是否可以从决策树中经过训练的树中提取出基本的决策规则(或“决策路径”)作为文本列表? 就像是: 谢谢你的帮助。 问题答案: 我相信这个答案比这里的其他答案更正确: 这会打印出有效的Python函数。这是一个试图返回其输入的树的示例输出,该数字介于0和10之间。 这是我在其他答案中看到的一些绊脚石: 使用来决定一个节点是否为叶是不是一个好主意。如果它是阈值为-2的真实决策节点怎么办?相
问题内容: 我是使用sciki-learn的菜鸟,所以请多多包涵。 我正在查看示例:http : //scikit-learn.org/stable/modules/tree.html#tree from sklearn.datasets import load_iris from sklearn import tree iris = load_iris() clf = tree.Decision
问题内容: 我可以从决策树中经过训练的树中提取出基本的决策规则(或“决策路径”)作为文本列表吗? 就像是: 谢谢你的帮助。 问题答案: 我相信这个答案比这里的其他答案更正确: 这会打印出有效的Python函数。这是尝试返回其输入的树的示例输出,该数字介于0到10之间。 这是我在其他答案中看到的一些绊脚石: 使用tree_.threshold == -2来决定一个节点是否为叶是不是一个好主意。如果它
问题内容: 我目前正在使用python的scikit库使用线性内核执行多类SVM。样本训练数据和测试数据如下: 型号数据: 我想绘制决策边界并可视化数据集。有人可以帮忙绘制此类数据吗? 上面给出的数据只是模拟数据,因此可以随时更改值。如果至少您可以建议要执行的步骤,这将很有帮助。提前致谢 问题答案: 您只需选择2个功能即可。 原因是您无法绘制7D图。选择2个要素后,仅将其用于决策面的可视化。 (我
scikit-learn 是一个 Python 的机器学习项目。是一个简单高效的数据挖掘和数据分析工具。基于 NumPy、SciPy 和 matplotlib 构建。 Installation 依赖 scikit-learn 要求: Python (>= 2.7 or >= 3.3) NumPy (>= 1.8.2) SciPy (>= 0.13.3) 运行示例需要 Matplotlib >= 1