三个有名的决策树算法:CHAID、CART和C4.5
生活随笔
收集整理的這篇文章主要介紹了
三个有名的决策树算法:CHAID、CART和C4.5
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
三個有名的決策樹算法:CHAID、CART和C4.5
CHAID、CART和C4.5大概是決策樹算法叢林中最有名,商業上運用也也最成功的算法了。CHAID (chi-squared automatic interaction detection,卡方自動交互檢測)的前身是AID,主要特征是多向分叉,前向修剪,其標準如名所示,就是卡方檢測;另外,CHAID只能處理類別型的輸入變量,因此連續型的輸入變量首先要進行離散處理。標準的CART(classification and regression trees)又不一樣,它只能進行二部分叉,后向修剪,分割標準用的是基尼系數(Gini Index);C4.5源自有名的ID3,它只能進行L型分叉,后向修剪,標準乃是基于信息論的“熵”(Entropy)。
摘自:http://johnthu.spaces.live.com/blog/cns!2053CD511E6D5B1E!148.entry
總結
以上是生活随笔為你收集整理的三个有名的决策树算法:CHAID、CART和C4.5的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 概率、信息和熵
- 下一篇: 数据采集策略:数据挖掘与统计学的一个区别