信用模型评分卡入门介绍
1、信用評分模型出現的動機是什么?
? 我們去銀行借款的時候,他們往往都會看我們的一些個人信息,比如,年齡,收入,家庭狀況,工作單位,婚姻狀況等,也會設置一些門檻,只有滿足了一定的門檻才會貸款于你。但是這種對單個指標設置的門檻會存在一些問題,比如:
(1)有些借款人雖說一些條件不滿足,但是其他條件都很好
(2)如何利用零散、非結構化的信息整合成科學的核額體系是一個難題
(3)貸后管理、資產質量分析和風險定價需要可量化的數字評價體系支持
? 這樣,一種信用評分就應運而生,解決了以上難題。具象的個體風險被標準化,分數的存在使得審批有了最簡單易用的判斷標準;整體的信貸資產質量也有了量化指標
2、信用評分的業務定義
?信用評分表面上是一個分數,實質上是一個模型。模型只是我們解決問題的手段,解決業務問題才是我們的目的。
?信用風險計量體系包含主體評級模型和債項評級模型,主體評級和債項評級均有一系列評級模型組成,其中主體評級模型可用“四張卡”來表示,分別是A卡、B卡、C卡和F卡;債項評級模型通常按照主體的融資用途,分為企業融資模型、現金流融資模型和項目融資模型等。
?我們通常所接觸到的評分大都用于信貸審批,即申請評分卡(A卡,Application scorecard)。同時,業內還常用的有B卡(Behavior scorecard)和C卡(Collection scorecard),分別用于貸后管理及催收管理。
?其中,它們的使用場景不同的:
A卡又稱為申請者評級模型,是使用最廣泛的,用于貸前審批階段對借款申請人的量化評估;
B卡又稱為行為評級模型,主要任務是通過借款人的還款及交易行為,結合其他維度的數據預測借款人未來的還款能力和意愿;
C卡又催收評級模型,是在借款人當前還款狀態為逾期的情況下,預測未來該筆貸款變為壞賬的概率,由此衍生出滾動率、還款率、失聯率等細分的模型;
F卡有稱為欺詐評級模型,主要應用于相關融資類業務中新客戶可能存在的欺詐行為的預測管理。
?不同的評分卡,對數據的要求和所應用的建模方法會不一樣。
?不同的產品,評分標準也不盡相同,評分模型也不相同。比如,對于小額短期利率高的現金貸來說,逾期30天+已經非常嚴重,催回的可能性非常小,那么相對應的模型會界定M1以上客戶為壞客戶。但對于車輛抵押貸款的借款人來說,考慮到抵押物,還很有可能還款,所以我們可能會選擇界定M2甚至M3以上的客戶為壞客戶。所以,在做模型的時候,也要思考當下的模型與當前的業務模式的匹配程度。
3、信用評分模型的建立
信用評分模型建立的一般過程如下圖:
(1)準備數據
?準備一個足夠大的數據樣本,并且樣本的特征數也盡量多些
(2)數據處理
?從生產環境導出的數據往往并不完美,有大量影響分析的缺失值和異常值。我們需要剔除缺失率太高的變量,剔除按業務邏輯完全不可解釋的變量等等。這是一個聽起來很簡單但實際上需要耗費大量精力的過程,會極大影響到模型準確性。
(3)變量分析
?通過對特征變量的相關性、共線性等的分析,篩選出對預測結果重要的特征,便于后期建模使用。
(4)評分卡構建
?現在我們已經擁有了一些非常“優秀”的變量,那我們怎么利用這些變量得到我們所需要的答案呢?這是一個已知X求Y的問題,我們需要選擇一個合適的模型方法去解決和預測。常見的模型方法有線性回歸、非線性回歸分析、決策樹等等。
其中,邏輯回歸是在信用評分卡開發中非常有代表性的模型方法。在這個模型中,經過上述篩選的每一個變量會進行證據權重轉換(WOE 即 Weight of Evidence),邏輯回歸可以將我們所熟知的借款人特征轉化為一個標準的評分卡,當我們輸入這些變量的具體值的時候,可以得到相應的分數。
4、信用評分卡的評估指標
?一般來說,信用評分卡模型的評估指標可以分為兩類:
(1)預測能力指標,用于評估模型對違約事件的預測能力,如:WOE/IV、ROC/AUC、K-S指標、GINI系數等
(2)穩定性指標,用于評估模型在訓練樣本和測試樣本中預測能力的一致性,如PSI指標等
?下面對一些指標進行解釋一下:
1.WOE、IV
WOE的全稱是“Weight of Evidence”,即證據權重。WOE是對原始自變量的一種編碼形式。
要對一個變量進行WOE編碼,需要首先把這個變量進行分組處理(也叫離散化、分箱等等,說的都是一個意思)。分組后,對于第i組,WOE的計算公式如下:
WOE=ln(pyipni)=ln(yiyTninT)WOE=ln(pyipni)=ln(yiyTninT)
其中,yIyI表示對于第i組,違約的個數,yTyT表示對于總樣本,總違約的個數
nini表示對于第i組,正常的個數,nTnT表示對于總樣本,總正常的個數
從這個角度來理解,WOE就是“當前分組中違約的占總違約的比例”與“當前分組中正常的占總正常的比例”之間的差異
對此公式做一個簡單變換,可以得到:WOE=ln(pyipni)=ln(yiniyTnT)WOE=ln(pyipni)=ln(yiniyTnT)
從這個角度來理解,WOE就是指“當前分組中,違約與正常的比例”與“總樣本中違約與正常的比例”之間的差異
有了前面的WOE值的計算之后,我們再來學習一下IV值的計算方式:IVi=(pyi?pni)?WOEiIVi=(pyi?pni)?WOEi
有了一個變量各分組的IV值,我們就可以計算整個變量的IV值,方法很簡單,就是把各分組的IV相加:IV=∑i=1nIViIV=∑i=1nIVi,其中,n為變量分組個數。
我們進一步理解一下WOE,會發現,WOE其實描述了變量當前這個分組,對判斷個體是否會響應(或者說屬于哪個類)所起到影響方向和大小,當WOE為正時,變量當前取值對判斷個體是否會響應起到的正向的影響,當WOE為負時,起到了負向影響。而WOE值的大小,則是這個影響的大小的體現。
2.ROC、AUC曲線
?首先先了解一些混淆矩陣的知識:
TP(True Positive):將正類樣本預測為正類,即真陽性
FP(False Positive):將負類樣本預測為正類,即假陽性
TN(True Negative):將負類樣本預測為負類,即真陰性
FN(False Negative):將正類樣本預測為負類,即假陰性
則精準率(Precision)P=TPTP+FPP=TPTP+FP?-----可以理解為從結果看,在所有預測為正類的樣本里,預測正確的占比
召回率(Recall)R=TPTP+FNR=TPTP+FN?-----可以理解為在原始的正類樣本中,被預測正確的樣本的占比
假陽性率(False Positive Rate)FPR=FPNFPR=FPN----其中N為樣本中負樣本的個數
真陽性率(True Positive Rate)TPR=TPPTPR=TPP----其中P為樣本中正樣本的個數
好吧,原諒我今天才發現一個問題:原來召回率和真陽性率是一樣的。。。
?舉個例子
?假設一個醫院有10位疑似癌癥患者,其中有3位很不幸確實患了癌癥(P=3),另外7位不是癌癥患者(N=7),醫院對這10位疑似患者進行診斷,診斷出3為癌癥患者,其中有2位是真正的患者(TP=2),那么真陽性率為TPR=TPP=23TPR=TPP=23,對于七位非癌癥患者而言,有1位很不幸被誤診為癌癥患者(FP = 1)。
那么假陽性率為FPR=FPN=17FPR=FPN=17,那么對于“醫院”這個分類器來說,這組結果就對應ROC曲線上的一個點(23,17)(23,17)。
?AUC曲線就是ROC曲線下方的面積大小,該值能夠量化地反映出基于ROC曲線衡量出的模型性能。計算AUC值只需要沿著ROC曲線橫軸做積分就可以了。由于ROC曲線一般都在曲線y=xy=x的上方,因此AUC的值一般都在0.5--1之間,AUC值越大,說明分類器越可能把真正的正樣本排在前面,分類性能就越好。
3.K-S指標
?作為一個模型,我們當然希望這個模型能夠幫我們挑選到最多的好客戶,同時不要放進來那么多壞客戶。K-S值就是一個這樣思路的指標。比如,在完成一個模型后,將測試模型的樣本平均分成10組,以好樣本占比降序從左到右進行排列,其中第一組的好樣本占比最大,壞樣本占比最小。這些組別的好壞樣本占比進行累加后得到每一組對應的累計的占比。好壞樣本的累計占比隨著樣本的累計而變化(圖中Good/Bad兩條曲線),而兩者差異最大時就是我們要求的K-S值(圖中比較長的直線箭頭的那個位置)。
KS值的取值范圍是[0,1]。通常來說,值越大,表明正負樣本區分的程度越好。一般,KS值>0.2就可認為模型有比較好的預測準確性。
4.GINI系數
?還記得經濟學中那個著名的基尼系數嗎?下圖應該可以讓你回憶起來。將一個國家所有的人口按最貧窮到最富有進行排列,隨著人數的累計,這些人口所擁有的財富的比例也逐漸增加到100%,按這個方法得到圖中的曲線,稱為洛倫茲曲線。基尼系數就是圖中A/B的比例。可以看到,假如這個國家最富有的那群人占據了越多的財富,貧富差距越大,那么洛倫茨曲線就會越彎曲,基尼系數就越大。
?同樣的,假設我們把100個人的信用評分按照從高到低進行排序,以橫軸為累計人數比例,縱軸作為累計壞樣本比例,隨著累計人數比例的上升,累計壞樣本的比例也在上升。如果這個評分的區分能力比較好,那么越大比例的壞樣本會集中在越低的分數區間,整個圖像形成一個凹下去的形狀。所以洛倫茲曲線的弧度越大,基尼系數越大,這個模型區分好壞樣本的能力就越強。
總結
以上是生活随笔為你收集整理的信用模型评分卡入门介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度解析两种信用评估模型
- 下一篇: 从生命周期去看互联网金融产品的风险管理框