主成分与因子分析异同_因子分析
1 導言
因子分析是將多個實測變量簡化為較少變量的方法。
利用因子分析能簡化分析,更能反映事物本質。
學習因子分析能確定哪些變量應該保留,哪些應該剔除,并得到主要成分的表達式,這些表達式是原有變量的線性組合,而用這些主要成分便能代替原來眾多的實測變量。
2 因子分析的功能與應用
由于在實際工作中,指標間經常具備一定的相關性,故人們希望用較少的指標代替原來較多的指標,但依然能反映原有的全部信息,于是就產生了主成分分析、對應分析、典型相關分析和因子分析等方法。
3 因子分析實例
例:表12-1 是25名健康人的7項生化檢驗結果,7項生化檢驗指標一次命名為X1-X7,請對該資料進行因子分析。
建立數據文件,定義變量名:分別為X1、X2、X3、X4、X5、X6、X7,按順序輸入相應數值,如圖12-1所示。
從Analyze----Data Reduction----Factor,彈出Factor Analysis對話框。在對話框左側變量列表中選變量X1-X7,點擊向右的箭頭按鈕使之進入Variables框,如圖12-2所示。
點擊Descriptives按鈕,彈出Factor Analysis: Descriptives對話框,在Statistics 中選Univariate descriptives 項要求輸出各變量的均數與標準差,在Correlation Matrix欄中選Coefficients 項要求計算相關系數矩陣,并選KMO and Bartlett’s test of sphericity 項,要求對相關系數矩陣進行統計學檢驗,如圖12-3所示。點擊Continue 按鈕返回Factor Analysis對話框。
點擊Extraction 按鈕,彈出Factor Analysis: Extraction對話框,本例選用Principal components 方法,如圖12-5所示。之后點擊Continue 按鈕返回Factor Analysis 對話框。
點擊Scores 按鈕,彈出Factor Analysis: Scores 對話框,系統提供3種估計因子得分系數的方法,本例選用Regression(回歸因子得分),如圖12-6所示。之后點擊Continue 按鈕返回Factor Analysis 對話框,再點擊OK按鈕即完成分析。
得到結果如下表12-2 到表12-9 和圖12-7 所示。
結果分析:
表12-2、12-3、12-4 顯示,系統首先輸出各變量的均數(Mean)與標準差(Std Dev),并顯示共有25例觀察單位進入分析:接著輸出相關系數矩陣(Correlation Matrix),經過Bartlett檢驗表明:Bartlett值=326.285,P小于0.0001,即相關矩陣不是一個單位矩陣,故考慮進行因子分析;Kaiser-Meyer-Olkin Measure of Sampling Adequacy 是用于比較觀測相關系數值與偏相關系數值的一個指標,其值越逼近1,表明這些變量進行因子分析效果越好,今KMO值=0.321,偏小,意味著因子分析的結果可能不能接受。
表12-5、12-6 、12-7顯示,使用主成分分析法得到2個因子,因子矩陣(Factor Matrix)如下,變量與某一因子的聯系系數絕對值越大,則該因子與變量關系越近。如本例變量X7與第一因子的值為-0.886,與第二因子的值為0.219,可見其與第一因子更近,與第二因子更遠,或者因子矩陣也可以作為因子貢獻大小的度量,其絕對值越大,貢獻也越大。在Final Statistics 一欄中顯示了各因子解釋掉方差的比例,也稱變量的共同度(Communality)。共同度從0到1,0為因子且不解釋任何方差,1 為所有方差均被因子解釋掉。一個因子解釋掉變量的方差越大,說明因子包含原有變量信息的量越多。
表12-8和表12-9 顯示,經正交旋轉后的因子負荷矩陣(Rotated Factor Matrix)和因子轉換矩陣(Factor Transformation Matrix)。旋轉的目的是使復雜的矩陣變得簡潔,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。
圖12-7顯示,將第一因子的因子分用變量名fac-1、第二以你這的因子分用變量名fac-2存入原始數據庫中。這些值既可用于模型診斷,又可用于進一步分析。
如果有幫助到你,請關注公眾號“藥小姐呀”更多關于數據分析的內容分享給你,謝謝你這么可愛還關注我。
總結
以上是生活随笔為你收集整理的主成分与因子分析异同_因子分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: webstorm配置环境变量_webst
- 下一篇: 攻防世界php2_攻防世界-php2