【图解】ROC曲线
參考文章:
http://blog.csdn.net/l18930738887/article/details/46681597
http://blog.csdn.net/u010159842/article/details/49562885
待補充...
曲線及部分應用,如有任何問題或錯誤歡迎各位留言~~
一、隨機選取用戶營銷的解釋(隨機線)
橫軸:營銷用戶數(假設有1000萬用戶數手機號)
縱軸:有響應的用戶數(假設如果1000萬全部發短信營銷,最高會有100萬人響應)
即總體響應的用戶數占營銷用戶數的10%。
如果我們隨機抽取營銷用戶數做短信營銷時,得到結果應該接近于總體概率。即:
| 營銷人數(萬) | 隨機響應人數(萬) |
| 0 | 0 |
| 200 | 20 |
| 400 | 40 |
| 600 | 60 |
| 800 | 80 |
| 1000 | 100 |
?
計算機根據相應的點形成隨即抽取曲線,即為未做模型的情況下隨機生成的用戶營銷數據輸入輸出的對應折線。
二、模型線解釋
通常計算機通過用戶的信息(如地理位置,收入情況,訪問網站產品的行為),進而判斷哪些人更可能對短信進行響應,依次排序,把可能性高的用戶排在最前面先進行營銷。然后得到以下數據:
| 營銷人數(萬) | 隨機響應人數(萬) | 模型響應人數(萬) |
| 0 | 0 | 0 |
| 200 | 20 | 30 |
| 400 | 40 | 55 |
| 600 | 60 | 70 |
| 800 | 80 | 90 |
| 1000 | 100 | 100 |
計算機根據相應的點形成模型響應曲線
如果我們要向1000萬人全部發送短信營銷時,模型與隨機線沒有區別.
如果我們只有營銷500萬人次的短信成本時,采用模型線即可讓我們的效率比隨機抽樣大幅度提高。隨機響應50萬人,模型響應80萬人。
這也就是為什么我們要用模型去做營銷。
?
總結ROC曲線的用處:
用來判斷模型的好壞,ROC是一個非常重要的指標。曲線越是靠向左上角,那么模型對于業務也就更有用處。
?
接下來的問題是:
我們怎么去把這個模型曲線做得好呢?答案就是用準確的字段及算法.
對于計算機我們給予它相關的字段信息及算法時,它就能做出相應的預測。關于字段選取及算法選取請看其他相關文章~~
總結
- 上一篇: 【图解】梯度下降
- 下一篇: 【总结】分类、聚类的评估指标