关联规则算法php,科学网—加权关联规则权值的计算 - 叶文菁的博文
加權關聯規則挖掘(以apriori和fp-tree算法為例)的權值計算。
以下面的數據為例來進行說明,表2中的交易權重和歸一化權重只是截圖結果,這里的具體數值可不要考慮。
加權支持度的計算為Sup(B)=count(B)*W(B)/總數;Sup(BD)=count(BD)*W(BD)/總數。
這里就是討論W(BD)有幾種計算方法及其優劣。
根據表1和表2可以很容易計算出單個項目的支持度,如Sup(B)=5*1/6=0.83
若要計算多個項目的支持度,如Sup(BD),Sup(BDA)那么項集BD或BDA的權值應該如何選取,即計算交易權重的方法,有以下幾種:
1、取每條交易記錄的最大值,如BDAC中權值最大的那個作為權值
2、取平均值,表2的交易權重即為該方法計算得出,這樣計算不能突出重點項目
3、歸一化值:Wi''=Wi/(W1+W2+……+Wk) ;W=(W1''+W2''+……+Wk'')/n,權值可能很小
4、
5、該方法的權值可能大于1
6、W(AB)=W(A)*W(B)/(W(A)+W(B))
7、若數據有兩個維度,即X,Y分別屬于不同維度,如X表示所購買的商品,Y表示購買的位置,則權值可以這樣計算:W(X)*W(Y)
若權值大于1,可以進行歸一化處理。
總之,權值的計算還有很多方法,計算時要根據自己數據的特點來選定。但是要注意關聯規則挖掘的頻繁及向下封閉的特性,即如果{AB}或{C}不頻繁,則{ABC}也不頻繁。如上述方法1、2就不可保證該特性,會造成數據的流失。這時候需要對關聯規則算法進行改進,來適應權值的需要。
轉載本文請聯系原作者獲取授權,同時請注明本文來自葉文菁科學網博客。
鏈接地址:http://blog.sciencenet.cn/blog-882768-742786.html
上一篇:weka進行關聯規則挖掘Apriori篇
下一篇:帶背景word如何轉成pdf格式(2010)及提取背景圖片
總結
以上是生活随笔為你收集整理的关联规则算法php,科学网—加权关联规则权值的计算 - 叶文菁的博文的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 相邻记录日期差 oracle,sql 相
- 下一篇: 海马铭嘉床垫怎样?