因子分析在各行各業(yè)的應(yīng)用非常廣泛,尤其是科研論文中因子分析更是頻頻出現(xiàn)。小兵也湊個(gè)熱鬧,參考《SPSS統(tǒng)計(jì)分析》書(shū)中的案例,運(yùn)用SPSS進(jìn)行因子分析,作為我博客 SPSS案例分析系列 的第三篇文章。
【一、概念】
探討具有相關(guān)關(guān)系的變量之間,是否存在不能直接觀察到的,但對(duì)可觀測(cè)變量的變化其支配作用的潛在因素的分析方法就是因子分析,也叫因素分析。通俗點(diǎn):因子分析是尋找潛在的、起支配作用因子的方法。
【二、簡(jiǎn)單實(shí)例】
現(xiàn)在有 12 個(gè)地區(qū)的 5 個(gè)經(jīng)濟(jì)指標(biāo)調(diào)查數(shù)據(jù)(總?cè)丝?、學(xué)校校齡、總雇員、專業(yè)服務(wù)、中等房?jī)r(jià)),為對(duì)這 12 個(gè)地區(qū)進(jìn)行綜合評(píng)價(jià),請(qǐng)確定出這 12 個(gè)地區(qū)的綜合評(píng)價(jià)指標(biāo)。點(diǎn)擊下載
【三、解決方案】
1、spss因子分析
同一指標(biāo)在不同地區(qū)是不同的,用單一某一個(gè)指標(biāo)難以對(duì)12個(gè)地區(qū)進(jìn)行準(zhǔn)確的評(píng)價(jià),單一指標(biāo)智能反映地區(qū)的某一方面。所以,有必要確定綜合評(píng)價(jià)指標(biāo),便于對(duì)比。因子分析是一個(gè)不錯(cuò)的選擇,5 個(gè)指標(biāo)即為我們分析的對(duì)象,我們希望從這5個(gè)可觀測(cè)指標(biāo)中尋找出潛在的因素,用這些具有綜合信息的因素對(duì)各地區(qū)進(jìn)行評(píng)價(jià)。下圖是spss因子分析的操作界面,主要包括5方面的選項(xiàng),變量區(qū)只能選擇數(shù)值型變量,分類(lèi)型變量不能進(jìn)入該模型。另外,spss軟件為了消除不同變量間量綱和數(shù)量級(jí)對(duì)結(jié)果的影響,在該過(guò)程中默認(rèn)自動(dòng)進(jìn)行標(biāo)準(zhǔn)化處理,因此不需要對(duì)這些變量提前進(jìn)行標(biāo)準(zhǔn)化處理。
2、描述統(tǒng)計(jì)選項(xiàng)卡
我們希望看到各變量的描述統(tǒng)計(jì)信息,要對(duì)比因子提取前后的方差變化,所以選定“單變量描述性”和“原始分析結(jié)果”;現(xiàn)在是基于相關(guān)矩陣提取因子,所以,選定相關(guān)矩陣的“系數(shù)和顯著性水平“,比較重要的還有 KMO 和球形檢驗(yàn),通過(guò)KMO值,我們可以初步判斷該數(shù)據(jù)集是否適合采用因子分析方法。比較糟糕的是,kmo結(jié)果有時(shí)并不會(huì)出現(xiàn),這主要與變量個(gè)數(shù)和樣本量大小有關(guān)。
3、抽取選項(xiàng)卡
在該選項(xiàng)卡中設(shè)置如何提取因子,提取因子的方法有很多,最常用的就是主成分法。因?yàn)閰⑴c分析的變量測(cè)度單位不同,所以選擇“相關(guān)矩陣”,如果參與分析的變量測(cè)度單位相同,則考慮選用協(xié)方差矩陣。經(jīng)常用到碎石圖對(duì)于判斷因子的個(gè)數(shù)很有幫助,一般都會(huì)選擇該項(xiàng)。關(guān)于特征值,不想解釋太多,這和顯著性水平一樣,都是統(tǒng)計(jì)學(xué)的一個(gè)基本概念。一般spss默認(rèn)只提取特征值大于1的因子,但,我還可以通過(guò)自定義設(shè)置需要提取的因子個(gè)數(shù)。另外,收斂次數(shù)比較重要,可以從首次結(jié)果反饋的信息進(jìn)行調(diào)整。
4、因子旋轉(zhuǎn)選項(xiàng)卡
因子分析要求對(duì)因子給予命名和解釋,對(duì)因子旋轉(zhuǎn)與否取決于因子的解釋。如果不經(jīng)旋轉(zhuǎn)因子已經(jīng)很好解釋,那么沒(méi)有必要旋轉(zhuǎn),否則,應(yīng)該旋轉(zhuǎn)。這里直接旋轉(zhuǎn),便于解釋。至于旋轉(zhuǎn)就是坐標(biāo)變換,使得因子系數(shù)向1 和 0 靠近,對(duì)公因子的命名和解釋更加容易。旋轉(zhuǎn)方法一般采用”最大方差法“即可,輸出旋轉(zhuǎn)后的因子矩陣和載荷圖,對(duì)于結(jié)果的解釋非常有幫助。
5、保存因子得分
要計(jì)算因子得分,就必須先寫(xiě)出因子的表達(dá)式。而因子是不能直接觀察到的,是潛在的。但是可以通過(guò)可觀測(cè)到的變量獲得。前面說(shuō)到,因子分析模型是原始變量為因子的線性組合,現(xiàn)在我們可以根據(jù)回歸的方法將模型倒過(guò)來(lái),用原始變量也就是參與分析的變量來(lái)表示因子。從而得到因子得分。因子得分作為變量保存,對(duì)于以后深入分析很有用處。
【四、結(jié)果解釋】
1、驗(yàn)證數(shù)據(jù)是否適合做因子分析
主要參考kmo結(jié)果,一般認(rèn)為大于0.5,即可接受。同時(shí)還可以參考相關(guān)系數(shù),一般認(rèn)為分析變量的相關(guān)系數(shù)多數(shù)大于 0.3,則適合做因子分析;從 KMO=0.575 檢驗(yàn)來(lái)看,不是特別適合因子分析,基本可以通過(guò)。這里主要是為了簡(jiǎn)單介紹因子分析,所以,不看重這一結(jié)果。
2、因子方差表
提取因子后因子方差的值均很高,表明提取的因子能很好的描述這 5 個(gè)指標(biāo)。方差分解表也表明,默認(rèn)提取的前兩個(gè)因子能夠解釋 5 個(gè)指標(biāo)的 93.4%。碎石圖表明,從第三個(gè)因子開(kāi)始,特征值差異很小。綜合以上,提取前兩個(gè)因子。
3、因子矩陣
由旋轉(zhuǎn)因子矩陣可以看出,經(jīng)旋轉(zhuǎn)后,因子便于命名和解釋。因子 1主要解釋的是中等房?jī)r(jià)、專業(yè)服務(wù)項(xiàng)目、中等校平均校齡,可以命名為社會(huì)福利因子;而因子 2 主要解釋的是其余兩個(gè)指標(biāo),總?cè)丝诤涂偣蛦T??梢悦麨槿丝谝蜃印R蜃臃治鲆螅詈蟮玫降囊蜃又g相互獨(dú)立,沒(méi)有相關(guān)性,而因子轉(zhuǎn)換矩陣顯示,兩個(gè)因子相關(guān)性較低??梢?jiàn),對(duì)因子進(jìn)行旋轉(zhuǎn)是完全有必要的。
4、因子系數(shù)
因子得分就是根據(jù)這個(gè)系數(shù)和標(biāo)準(zhǔn)化后的分析變量得到的。其次,在數(shù)據(jù)視圖中可以看到因子得分變量。
5、結(jié)論
經(jīng)過(guò)因子分析,我們的目的實(shí)現(xiàn)了,找到了兩個(gè)綜合評(píng)價(jià)指標(biāo),即人口因子和福利因子。從原來(lái)的 5 個(gè)指標(biāo)挖掘出 2 個(gè)潛在的綜合因子。可以對(duì)12 個(gè)地區(qū)給出客觀評(píng)價(jià)。
我們可以根據(jù)因子1或者因子2得分,對(duì)這12個(gè)地區(qū)進(jìn)行從大到小排序,得分高者被認(rèn)為在這個(gè)維度上有較好表現(xiàn)。一般上因子分析到此就已經(jīng)結(jié)束了,如果想再進(jìn)一步展開(kāi)分析,一般可以采取兩種方式,第一是進(jìn)行因子綜合得分的計(jì)算,用一個(gè)總得分對(duì)樣本進(jìn)行大小排序,得分高者為佳;第二,將得到的若干因子作為新的變量,進(jìn)行聚類(lèi)分析,這兩種方式,均單獨(dú)有文字介紹。見(jiàn)以下鏈接:1綜合得分;2用于聚類(lèi)分析
轉(zhuǎn)載或分享,請(qǐng)注明來(lái)自數(shù)據(jù)小兵博客,謝謝。
文章原創(chuàng)地址:http://hi.baidu.com/datasoldier/item/6689c4a50ec250dc5af1914c
聯(lián)系客服