怎么用clementine做关联规则分析
1、首先你得在你的電腦上安裝clementine,安裝方法我在另一篇博文上做出過說明。詳情請見:http://blog.csdn.net/u014374031/article/details/50082941 
 這里再分享一個下載連接http://yunpan.cn/c3JuBpTTs8EtZ 訪問密碼 4619 
 2、先準備好要分析的數據。
雖然說明書上說clementine可以打開excel保存的以制表符分隔的文本文件,但是正真使用的時候就會報錯。
現在我來教你們怎么正確輸入數據。 
 先在excel中打開數據,然后按住左鍵選中全部數據(注意這里不要ctrl+A全選數據,這樣不行。),Ctrl+C復制,新建一個文本文件,Ctrl+V粘貼,最后Ctrl+S保存。這樣這個文件就可以被clementine識別。clementine導入數據的方法是在源下面選中可變文件,拖放到流圖中,雙擊文件編輯它,在跳出對話框中選擇剛才創建的文本文件。如圖:
2、文件讀取成功之后你可以添加一個表格輸出,看看數據是否正確。 
 先在輸出下面選擇表,把它拖放到流圖上。
右鍵點擊可變文件選擇連接把可變文件和表連接起來。 
 
最后右擊表選擇執行,就可以看到數據了。簡不簡單,我覺得我說的像白癡一樣,再不懂就不能怪我了。 
  
 
3、上面數據都讀取成功后就是對數據的類型進行分類。 
 選擇“字段選項”下的類型,把它拖放到流圖中,按照上面介紹的方法把可變的源文件和類型進行連接。
雙擊“類型”,一般如果是0/1或者T/F來標記一行記錄中是否存在這種屬性的時候,我們一般都選這類型為flat標記,就是兩個圈圈的那個。如果某個列名下有多個屬性,想我的數據中診斷就有很多不同的診斷,這種情況下就選擇集合。其他的你們自己看著選。
方向的話,一般選擇both就好了。
這樣所有的類型就設置好了,進入下一步吧!
4、接下來的一步就是選擇算法進行分析。clementine關于關聯規則的算法有兩種,一種是Apriori,一種是GRI。這里我們選擇常用的Apriori算法。還是拖放“建模”選項下的Apriori到流圖,將類型和Apriori連接起來。 
  
 雙擊Aprior編輯,在第一個選項“字段”里選擇”使用定制設置”, 設置好規則的前項和后項。 
  
 然后在第二個選項里設置號最小支持度,最小置信度,以及最大前項數, 
 
最后右擊Apriori點擊運行,在右邊的框里雙擊”流“,就可以看到結果了。 
  
 
總結
以上是生活随笔為你收集整理的怎么用clementine做关联规则分析的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 一篇文章全搞懂!B2B
- 下一篇: 《Python数据分析与挖掘实战》第8章
