机器学习实战读书笔记--k邻近算法KNN
生活随笔
收集整理的這篇文章主要介紹了
机器学习实战读书笔记--k邻近算法KNN
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
k鄰近算法的偽代碼:
對未知類別屬性的數據集中的每個點一次執行以下操作:
(1)計算已知類別數據集中的點與當前點之間的距離;
(2)按照距離遞增次序排列
(3)選取與當前點距離最小的k個點
(4)確定前k個點所在類別的出現頻率
(5)返回前k個點出現頻率最好的類別作為當前點的預測分類
?
python函數實現
''' Created on Sep 16, 2010 kNN: k Nearest NeighborsInput: inX: vector to compare to existing dataset (1xN)dataSet: size m data set of known vectors (NxM)labels: data set labels (1xM vector)k: number of neighbors to use for comparison (should be an odd number)Output: the most popular class label@author: pbharrin '''def classify0(inX, dataSet, labels, k):dataSetSize = dataSet.shape[0] //輸入的訓練樣本集dataSet的列數diffMat = tile(inX, (dataSetSize,1)) - dataSet //先對inX進行向量化處理,使之格式與dataSet一致,然后相減sqDiffMat = diffMat**2 //向量對應值差的平方sqDistances = sqDiffMat.sum(axis=1)//列的平方和的匯總distances = sqDistances**0.5 //開平方求距離sortedDistIndicies = distances.argsort() classCount={} for i in range(k):voteIlabel = labels[sortedDistIndicies[i]]classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1 //選擇距離最小的k個點sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True) //排序return sortedClassCount[0][0]?
轉載于:https://www.cnblogs.com/davidwang456/p/9729676.html
總結
以上是生活随笔為你收集整理的机器学习实战读书笔记--k邻近算法KNN的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据挖掘导论读书笔记11异常检测
- 下一篇: 为什么一些机器学习模型需要对数据进行归一