风控评分卡建模全流程
生活随笔
收集整理的這篇文章主要介紹了
风控评分卡建模全流程
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
風控評分卡建模全流程
前言
本文將通過 python 代碼演示傳統評分卡建模的全流程,比較通用的一個版本。評分卡已經發展得非常成熟了,對于不同業務或者不同建模人員下的模型構建過程可以稱得上是大同小異。
微信閱讀可選擇點擊前往:風控評分卡建模全流程
個人水平有限,py coding 這塊著實造詣不深,目前多是"照葫蘆畫瓢",站在前輩們的肩膀上前行。由于代碼篇幅較長,先提前在這里感謝鋒大、翟錕老師等在建模方面給予的極大幫助定。
正文評分卡實現主要使用自定義函數以及謝博士的 scorecardpy 包進行處理,建模過程如下:
- 樣本準備
Kaggle&自定義樣本 - 建模變量探索和預處理
缺失值、異常值識別和替代
IV值、VIF共線性、相關系數、逐步回歸篩選
變量分箱處理 - 模型構建
邏輯回歸 - 模型評估
KS、AUC、PSI
模型得分分布、區分度曲線 - 評分卡
1.樣本準備
選取 Kaggle 官網提供的經典二分類樣本,原數據集都是數值型變量,為了更完整地展示建模流程,在此基礎上增加兩列分類變量。
通過以下鏈接,可獲取到樣本數據(training2.0)以及建模過程需要的兩個自定義py包(PlotModel和FeatureSelection)。
鏈接:
總結
以上是生活随笔為你收集整理的风控评分卡建模全流程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 自动化特征工程和自动建模在风控场景的应用
- 下一篇: doker zookeeper kafk