‘壹’ 关于python编程决策树的问题,有没有大神来解答。。。
有一本《集体智慧编程》的书,里面有详细的讲解,而且有python的示例代码。
建议你看看。
‘贰’ python构造决策树要调用什么包
调用这个包:
sklearn.tree
sklearn(scikit-learn)可以去http://www.lfd.uci.e/~gohlke/pythonlibs/#scikit-learn下载,解压后放入C:Python27Libsite-packages直接使用。需要用同样的方法额外下载numpy和scipy包,不然会报错。
例子:
fromsklearn.datasetsimportload_iris
fromsklearn.model_selectionimportcross_val_score
fromsklearn.
clf=DecisionTreeClassifier(random_state=0)
iris=load_iris()
cross_val_score(clf,iris.data,iris.target,cv=10)
‘叁’ python中的sklearn中决策树使用的是哪一种算法
sklearn中决策树分为DecisionTreeClassifier和DecisionTreeRegressor,所以用的算法是CART算法,也就是分类与回归树算法(classification and regression tree,CART),划分标准默认使用的也是Gini,ID3和C4.5用的是信息熵,为何要设置成ID3或者C4.5呢
‘肆’ 濡备綍鍒╃敤python杩涜屾暟鎹寤烘ā锛
Python鏁版嵁寤烘ā镄勪竴鑸杩囩▼鍙浠ュぇ镊村垎涓轰互涓嫔嚑涓姝ラわ细
1. 鏁版嵁鏀堕泦锛氶栧厛闇瑕佹敹闆嗘暟鎹銆傝繖鍙鑳藉寘𨰾浠庡叕寮鏁版嵁婧愩佹暟鎹搴撱佹枃浠躲丄PI绛夎幏鍙栨暟鎹銆备綘鍙鑳介渶瑕侀夋嫨阃傚綋镄勬暟鎹鏀堕泦宸ュ叿鎴栧簱锛屽俻andas镄剅ead_csv鍑芥暟鎴杛equests搴撴潵浠庣绣绔栾幏鍙栨暟鎹銆
2. 鏁版嵁娓呮礂锛氭敹闆嗗埌镄勬暟鎹鍙鑳藉瓨鍦ㄧ己澶卞笺侀敊璇鍊笺侀吨澶嶅肩瓑闂棰桡纴闇瑕佽繘琛屾竻娲椼傝繖涓姝ラ氩父鍖呮嫭鍒犻櫎閲嶅嶈屻佸~鍏呯己澶卞笺佸勭悊寮傚父鍊肩瓑銆傚彲浠ヤ娇鐢≒ython镄刾andas搴撹繘琛屾暟鎹娓呮礂銆
3. 鏁版嵁棰勫勭悊锛氭暟鎹棰勫勭悊鍖呮嫭鏁版嵁镙囧嗳鍖栥佸綊涓鍖栥佺紪镰佽浆鎹㈢瓑姝ラわ纴浠ヤ究浜庡悗缁镄勬暟鎹鍒嗘瀽銆傚彲浠ヤ娇鐢≒ython镄刾andas搴撹繘琛屾暟鎹棰勫勭悊銆
4. 鐗瑰緛鎻愬彇锛氭牴鎹镰旂┒闂棰桦拰鏁版嵁鐗圭偣锛屼粠鏁版嵁涓鎻愬彇鍑烘湁鐢ㄧ殑鐗瑰緛銆傝繖鍙鑳藉寘𨰾鏁板肩壒寰併佸垎绫荤壒寰併佹椂闂村簭鍒楃壒寰佺瓑銆傚彲浠ヤ娇鐢≒ython镄剆klearn搴撹繘琛岀壒寰佹彁鍙栥
5. 妯″瀷阃夋嫨涓庤缁冿细镙规嵁镰旂┒闂棰桦拰鏁版嵁鐗圭偣锛岄夋嫨钖堥傜殑链哄櫒瀛︿範妯″瀷杩涜岃缁冦傚父瑙佺殑链哄櫒瀛︿範妯″瀷鍖呮嫭绾挎у洖褰掋侀昏緫锲炲綊銆佸喅绛栨爲銆侀殢链烘.鏋椼佺炵粡缃戠粶绛夈傚彲浠ヤ娇鐢≒ython镄剆klearn搴撹繘琛屾ā鍨嬭缁冦
6. 妯″瀷璇勪及锛氢娇鐢ㄩ傚綋镄勬柟娉曞规ā鍨嬭繘琛岃瘎浼帮纴濡傚嗳纭鐜囥佸彫锲炵巼銆丄UC-ROC绛夋寚镙囥傝瘎浼扮粨鏋滃彲浠ュ府锷╀綘浜呜В妯″瀷镄勬ц兘锛屼粠钥岃繘琛岃皟鏁村拰浼桦寲銆
7. 妯″瀷搴旂敤涓庝紭鍖栵细灏嗘ā鍨嫔簲鐢ㄤ簬瀹为檯闂棰树腑锛屽苟镙规嵁搴旂敤缁撴灉瀵规ā鍨嬭繘琛屼紭鍖栧拰璋冩暣銆
𨰾揿𪾢鐭ヨ瘑锛
Python鐢辫嵎鍏板浗瀹舵暟瀛︿笌璁$畻链虹戝︾爷绌朵腑蹇幂殑钖夊·锣幂绥鑻忓嗕簬1990骞翠唬鍒濊捐★纴浣滀负涓闂ㄥ彨浣淎BC璇瑷镄勬浛浠e搧銆侾ython鎻愪緵浜嗛珮鏁堢殑楂樼骇鏁版嵁缁撴瀯锛岃缮鑳界亩鍗曟湁鏁埚湴闱㈠悜瀵硅薄缂栫▼銆侾ython璇娉曞拰锷ㄦ佺被鍨嬶纴浠ュ强瑙i喷鍨嬭瑷镄勬湰璐锛屼娇瀹冩垚涓哄氭暟骞冲彴涓婂啓鑴氭湰鍜屽揩阃熷紑鍙戝簲鐢ㄧ殑缂栫▼璇瑷锛岄殢镌鐗堟湰镄勪笉鏂镟存柊鍜岃瑷鏂板姛鑳界殑娣诲姞锛岄愭笎琚鐢ㄤ簬镫绔嬬殑銆佸ぇ鍨嬮”鐩镄勫紑鍙戙
Python鍦ㄥ悇涓缂栫▼璇瑷涓姣旇缉阃傚悎鏂版坠瀛︿範锛孭ython瑙i喷鍣ㄦ槗浜庢墿灞曪纴鍙浠ヤ娇鐢–銆丆++鎴栧叾浠栧彲浠ラ氲繃C璋幂敤镄勮瑷镓╁𪾢鏂扮殑锷熻兘鍜屾暟鎹绫诲瀷銆侾ython涔熷彲鐢ㄤ簬鍙瀹氩埗鍖栬蒋浠朵腑镄勬墿灞旷▼搴忚瑷銆侾ython涓板瘜镄勬爣鍑嗗簱锛屾彁渚涗简阃傜敤浜庡悇涓涓昏佺郴缁熷钩鍙扮殑婧愮爜鎴栨満鍣ㄧ爜銆
‘伍’ 如何将python生成的决策树画出来
示例
# http://scikit-learn.org/stable/moles/tree.html
>>> from IPython.display import Image
>>> dot_data = tree.export_graphviz(clf, out_file=None,
feature_names=iris.feature_names,
class_names=iris.target_names,
filled=True, rounded=True,
special_characters=True)
>>> graph = pydotplus.graph_from_dot_data(dot_data)
>>> Image(graph.create_png())
‘陆’ 向大神求教!python写的决策树的ID3算法怎么一直提示bestfeat=labels[bestfeat_index]超出索引啊!
1、对当前训练集,计算各属性的信息增益(假设有属性A1,A2,…An);
2、选择信息增益最大的属性Ak(1<=k<=n),作为根节点;
3、把在Ak处取值相同的例子归于同一子集,作为该节点的一个树枝,Ak取几个值就得几个子集;
4、若在某个子集中的所有样本都是属于同一个类型(本位只讨论正(Y)、反(N)两种类型的情况),则给该分支标上类型号作为叶子节点;
5、对于同时含有多种(两种)类型的子集,则递归调用该算法思路来完成树的构造。
‘柒’ python sklearn决策树的图怎么画
#coding=utf-8
from sklearn.datasets import load_iris
from sklearn import tree
iris = load_iris()
clf = tree.DecisionTreeClassifier()
clf = clf.fit(iris.data, iris.target)
from sklearn.externals.six import StringIO
import pydot
dot_data = StringIO()
tree.export_graphviz(clf, out_file=dot_data)
graph = pydot.graph_from_dot_data(dot_data.getvalue())
graph[0].write_dot('iris_simple.dot')
graph[0].write_png('iris_simple.png')