【伍六一的回答(7票)】:
謝邀,對(duì)于此問(wèn)題也不甚了解,只能粗略回答一下。
1.因子分析的基本步驟
(1)確認(rèn)待分析的原始變量是否適合作因子分析;
(2)構(gòu)造因子變量;
(3)利用旋轉(zhuǎn)方法使因子變量具有可解釋性;
(4)計(jì)算每個(gè)樣本的因子變量得分。
2.因子分析的數(shù)學(xué)模型
3.因素分析的主要方式
圍繞濃縮原有變量提取因子的核心目標(biāo),因子分析主要涉及以下五大基本步驟:
1、因子分析的前提條件
由于因子分析的主要任務(wù)之一是對(duì)原有變量進(jìn)行濃縮,即將原有變量中的信息重疊部分提取和綜合成因子,進(jìn)而最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。因此它要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則,如果原有變量相互獨(dú)立,相關(guān)程度很低,不存在信息重疊,它們不可能有共同因子,那么也就無(wú)法將其綜合和濃縮,也就無(wú)需進(jìn)行因子分析。本步驟正是希望通過(guò)各種方法分析原有變量是否存在相關(guān)關(guān)系,是否適合進(jìn)行因子分析。
SPSS提供了四個(gè)統(tǒng)計(jì)量可幫助判斷觀測(cè)數(shù)據(jù)是否適合作因子分析:
(1)計(jì)算相關(guān)系數(shù)矩陣Correlation Matrix
在進(jìn)行提取因子等分析步驟之前,應(yīng)對(duì)相關(guān)矩陣進(jìn)行檢驗(yàn),如果相關(guān)矩陣中的大部分相關(guān)系數(shù)小于0.3,則不適合作因子分析;當(dāng)原始變量個(gè)數(shù)較多時(shí),所輸出的相關(guān)系數(shù)矩陣特別大,觀察起來(lái)不是很方便,所以一般不會(huì)采用此方法或即使采用了此方法,也不方便在結(jié)果匯報(bào)中給出原始分析報(bào)表。
(2)計(jì)算反映象相關(guān)矩陣Anti-image correlation matrix
反映象矩陣重要包括負(fù)的協(xié)方差和負(fù)的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是在控制了其他變量對(duì)兩變量影響的條件下計(jì)算出來(lái)的凈相關(guān)系數(shù)。如果原有變量之間確實(shí)存在較強(qiáng)的相互重疊以及傳遞影響,也就是說(shuō),如果原有變量中確實(shí)能夠提取出公共因子,那么在控制了這些影響后的偏相關(guān)系數(shù)必然很小。
反映象相關(guān)矩陣的對(duì)角線上的元素為某變量的MSA(Measure ofSample Adequacy)統(tǒng)計(jì)量,其數(shù)學(xué)定義為:
觀察反映象相關(guān)矩陣,如果反映象相關(guān)矩陣中除主對(duì)角元素外,其他大多數(shù)元素的絕對(duì)值均小,對(duì)角線上元素的值越接近1,則說(shuō)明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。與(1)中最后所述理由相同,一般少采用此方法。
(3)巴特利特球度檢驗(yàn)Bartlett test of sphericity
Bartlett球體檢驗(yàn)的目的是檢驗(yàn)相關(guān)矩陣是否是單位矩陣(identity matrix),如果是單位矩陣,則認(rèn)為因子模型不合適。Bartlett球體檢驗(yàn)的虛無(wú)假設(shè)為相關(guān)矩陣是單位陣,如果不能拒絕該假設(shè)的話,就表明數(shù)據(jù)不適合用于因子分析。一般說(shuō)來(lái),顯著水平值越?。?lt;0.05)表明原始變量之間越可能存在有意義的關(guān)系,如果顯著性水平很大(如0.10以上)可能表明數(shù)據(jù)不適宜于因子分析。
(4)KMO(Kaiser-Meyer-OklinMeasure of Smapling Adequacy)
KMO是Kaiser-Meyer-Olkin的取樣適當(dāng)性量數(shù)。KMO測(cè)度的值越高(接近1.0時(shí)),表明變量間的共同因子越多,研究數(shù)據(jù)適合用因子分析。通常按以下標(biāo)準(zhǔn)解釋該指標(biāo)值的大小:KMO值達(dá)到0.9以上為非常好,0.8~0.9為好,0.7~0.8為一般,0.6~0.7為差,0.5~0.6為很差。如果KMO測(cè)度的值低于0.5時(shí),表明樣本偏小,需要擴(kuò)大樣本。
綜上所述,經(jīng)常采用的方法為巴特利特球度檢驗(yàn)Bartlett test of sphericity和KMO(Kaiser-Meyer-Oklin Measure of SmaplingAdequacy)。
2、抽取共同因子,確定因子的數(shù)目和求因子解的方法
將原有變量綜合成少數(shù)幾個(gè)因子是因子分析的核心內(nèi)容。本步驟正是研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取和綜合因子。決定因素抽取的方法,有“主成份分析法”(principal components analysis)、主軸法、一般化最小平方法、未加權(quán)最小平方法、最大概似法、Alpha因素抽取法與映象因素抽取法等。使用者最常使用的是主成份分析法與主軸法,其中,又以主成份分析法使用最為普遍,在SPSS使用手冊(cè)中,也建議研究者多采用主成份分析法來(lái)估計(jì)因素負(fù)荷量。所謂主成份分析法,就是以較少的成份解釋原始變量方差的較大部分。進(jìn)行主成份分析時(shí),先要將每個(gè)變量的數(shù)值轉(zhuǎn)換成標(biāo)準(zhǔn)值。主成份分析就是用多個(gè)變量組成一個(gè)多維空間,然后在空間內(nèi)投射直線以解釋最大的方差,所得的直線就是共同因子,該直線最能代表各個(gè)變量的性質(zhì),而在此直線上的數(shù)值所構(gòu)成的一個(gè)變量就是第一個(gè)共同因子,或稱第一因子。但是在空間內(nèi)還有剩余的方差,所以需要投射第二條直線來(lái)解釋方差。這時(shí),還要依據(jù)第二條準(zhǔn)則,即投射的第二條直線與第一條直線成直交關(guān)系,意為代表不同的方面。第二條直線上的數(shù)值所構(gòu)成的一個(gè)變量,稱為第二因子。依據(jù)該原理可以求出第三、第四或更多的因子。原則上,因子的數(shù)目與原始變量的數(shù)目相同,但抽取了主要的因子之后,如果剩余的方差很小,就可以放棄其余的因子,以達(dá)到簡(jiǎn)化數(shù)據(jù)的目的。
因子數(shù)目的確定沒(méi)有精確的定量方法,但常用的方法是借助兩個(gè)準(zhǔn)則來(lái)確定因子的個(gè)數(shù)。一是特征值(eigenvalue)準(zhǔn)則,二是碎石圖檢驗(yàn)(screetest)準(zhǔn)則。特征值準(zhǔn)則就是選取特征值大于或等于1的主成份作為初始因子,而放棄特征值小于1的主成份。因?yàn)槊總€(gè)變量的方差為1,該準(zhǔn)則認(rèn)為每個(gè)保留下來(lái)的因子至少應(yīng)該能解釋一個(gè)變量的方差,否則達(dá)不到精簡(jiǎn)數(shù)據(jù)的目的。碎石檢驗(yàn)準(zhǔn)則是根據(jù)因子被提取的順序繪出特征值隨因子個(gè)數(shù)變化的散點(diǎn)圖,根據(jù)圖的形狀來(lái)判斷因子的個(gè)數(shù)。散點(diǎn)曲線的特點(diǎn)是由高到低,先陡后平,最后幾乎成一條直線。曲線開(kāi)始變平的前一個(gè)點(diǎn)被認(rèn)為是提取的最大因子數(shù)。后面的散點(diǎn)類似于山腳下的碎石,可舍棄而不會(huì)丟失很多信息。
3、使因子更具有命名可解釋性
通常最初因素抽取后,對(duì)因素?zé)o法作有效的解釋。這時(shí)往往需要進(jìn)行因子旋轉(zhuǎn)(rotation),通過(guò)坐標(biāo)變換使因子解的意義更容易解釋。轉(zhuǎn)軸的目的在于改變題項(xiàng)在各因素負(fù)荷量的大小,轉(zhuǎn)軸時(shí)根據(jù)題項(xiàng)與因素結(jié)構(gòu)關(guān)系的密切程度,調(diào)整各因素負(fù)荷量的大小,轉(zhuǎn)軸后,使得變量在每個(gè)因素的負(fù)荷量不是變大(接近1)就是變得更?。ń咏?),而非轉(zhuǎn)軸前在每個(gè)因素的負(fù)荷量大小均差不多,這就使對(duì)共同因子的命名和解釋變量變得更容易。轉(zhuǎn)軸后,每個(gè)共同因素的特征值會(huì)改變,但每個(gè)變量的共同性不會(huì)改變。常用的轉(zhuǎn)軸方法,有最大變異法(Varimax)、四次方最大值法(Quartimax)、相等最大值法(Equamax)、直接斜交轉(zhuǎn)軸法(DirectOblimin)、Promax轉(zhuǎn)軸法,其中前三者屬于“直交轉(zhuǎn)軸法”(orthogonal rotations),在直交轉(zhuǎn)軸法中,因素(成份)與因素(成份)間沒(méi)有相關(guān),亦即其相關(guān)為0,因素軸間夾角為90°;而后二者(直接斜交轉(zhuǎn)軸、Promax轉(zhuǎn)軸法)屬“斜交轉(zhuǎn)軸”(oblique rotations),采用斜交轉(zhuǎn)軸法,表示因素與因素間彼此有某種程度的相關(guān),亦即因素軸間的夾角不是90°。
直交轉(zhuǎn)軸法的優(yōu)點(diǎn)是因素間提供的信息不會(huì)重疊,觀察體在某一個(gè)因素的分?jǐn)?shù)與在其它因素的分?jǐn)?shù),彼此獨(dú)立不相關(guān);而其缺點(diǎn)是研究者迫使因素間不相關(guān),但在實(shí)際情境中,它們彼此有相關(guān)的可能性很高。因而直交轉(zhuǎn)軸方法偏向較多人為操控方式,不需要正確響應(yīng)現(xiàn)實(shí)世界中自然發(fā)生的事件(Bryman&Cramer,1997)。
所謂直交旋轉(zhuǎn)法(orthogonal rotations),就是要求各個(gè)因子在旋轉(zhuǎn)時(shí)都要保持直角關(guān)系,即不相關(guān)。在直交旋轉(zhuǎn)時(shí),每個(gè)變量的共同性(commonality)是不變的。不同的直交旋轉(zhuǎn)方法有不同的作用。在直交旋轉(zhuǎn)法中,常用于社會(huì)科學(xué)研究的方式是Varimax旋轉(zhuǎn)法。該方法是在旋轉(zhuǎn)時(shí)盡量弄清楚在每一個(gè)因子上各個(gè)變量的因子負(fù)荷情況,也即讓因子矩陣中每一列的的值盡可能變成1或0,該旋轉(zhuǎn)法的作用是突出每個(gè)因子的性質(zhì),可以更清楚哪些變量是屬于它的。由此可見(jiàn),Varimax旋轉(zhuǎn)法可以幫助找出多個(gè)因子,以澄清概念的內(nèi)容。Quartimax旋轉(zhuǎn)法可以則可以盡量弄清楚每個(gè)變量在各個(gè)因子上的負(fù)荷情況,即讓每個(gè)變量在某個(gè)因子上的負(fù)荷盡可能等于1,而在其它因子上則盡可能等于0。該方法可以增強(qiáng)第一因子的解釋力,而使其它因子的效力減弱??梢?jiàn)Quartimax旋轉(zhuǎn)法適合于找出一個(gè)最強(qiáng)效力的因子。Equamax旋轉(zhuǎn)法則是一種折中的做法,即盡可能簡(jiǎn)化因子,也可弄清楚負(fù)荷情況。其缺點(diǎn)是可能兩方面都未照顧好。
斜交旋轉(zhuǎn)(oblique rotarion)方法是要求在旋轉(zhuǎn)時(shí)各個(gè)因子之間呈斜交的關(guān)系,表示允許該因子與因子之間有某種程度上的相關(guān)。斜交旋轉(zhuǎn)中,因子之間的夾可以是任意的,所以用斜交因子描述變量可以使因子結(jié)構(gòu)更為簡(jiǎn)潔。選擇直接斜交旋轉(zhuǎn)時(shí),必須指定Delta值。該值的取值范圍在0~-1之間,0值產(chǎn)生最高相關(guān)因子,大的負(fù)數(shù)產(chǎn)生旋轉(zhuǎn)的結(jié)果與直交接近。Promax斜交旋轉(zhuǎn)方法也允許因子彼此相關(guān),它比直接斜交旋轉(zhuǎn)更快,因此適用于大數(shù)據(jù)集的因子分析。
綜上所述,不同的因子旋轉(zhuǎn)方式各有其特點(diǎn)。因此,究竟選擇何種方式進(jìn)行因子旋轉(zhuǎn)取決于研究問(wèn)題的需要。如果因子分析的目的只是進(jìn)行數(shù)據(jù)簡(jiǎn)化,而因子的確切含義是什么并不重要,就應(yīng)該選擇直交旋轉(zhuǎn)。如果因子分析的目的是要得到理論上有意義的因子,應(yīng)該選擇斜交因子。事實(shí)上,研究中很少有完全不相關(guān)的變量,所以,從理論上看斜交旋轉(zhuǎn)優(yōu)于直交旋轉(zhuǎn)。但是斜交旋轉(zhuǎn)中因子之間的斜交程度受研究者定義的參數(shù)的影響,而且斜交選裝中所允許的因子之間的相關(guān)程度是很小的,因?yàn)闆](méi)有人會(huì)接受兩個(gè)高度相關(guān)的共同因子。如果兩個(gè)因子確實(shí)高度相關(guān),大多數(shù)研究者會(huì)選取更少的因子重新進(jìn)行分析。因此,斜交旋轉(zhuǎn)的優(yōu)越性大打折扣。在實(shí)際研究中,直交旋轉(zhuǎn)(尤其是Varimax旋轉(zhuǎn)法)得到更廣泛的運(yùn)用。
4、決定因素與命名
轉(zhuǎn)軸后,要決定因素?cái)?shù)目,選取較少因素層面,獲得較大的解釋量。在因素命名與結(jié)果解釋上,必要時(shí)可將因素計(jì)算后之分?jǐn)?shù)存儲(chǔ),作為其它程序分析之輸入變量。
5、計(jì)算各樣本的因子得分
因子分析的最終目標(biāo)是減少變量個(gè)數(shù),以便在進(jìn)一步的分析中用較少的因子代替原有變量參與數(shù)據(jù)建模。本步驟正是通過(guò)各種方法計(jì)算各樣本在各因子上的得分,為進(jìn)一步的分析奠定基礎(chǔ)。
地質(zhì)生一枚,Geology isn't a real science!啊……
【舒墨的回答(2票)】:
這個(gè)問(wèn)題,在知乎上掛了好多天,回答的人也很少(幾乎沒(méi)有╮(╯_╰)╭),大概是因?yàn)槲覄傞_(kāi)始用知乎,沒(méi)什么人緣,只是根據(jù)系統(tǒng)推薦邀請(qǐng)了幾個(gè)人回答,所以可能沒(méi)什么人看到我的問(wèn)題吧。所以,感謝一樓回答的那位。
后來(lái),我自己又查找各種資料,終于找到了因子分析的手算方法了。
如下,因子分析的數(shù)學(xué)模型
手算步驟——手算步驟——
1.標(biāo)準(zhǔn)化原始數(shù)據(jù)X,具體方法可以在網(wǎng)上“輕易”找到
2.計(jì)算X的相關(guān)系數(shù)矩陣R(手算比較繁瑣,但SPSS很容易導(dǎo)出)
3.也是我當(dāng)時(shí)最困惑的一點(diǎn),如何計(jì)算出 因子載荷陣A(沒(méi)有求出A,那么一切都無(wú)法繼續(xù)啊啊啊,所以A應(yīng)該怎么求啊啊啊,如下)
(1)求R的特征值λ1≥λ2≥λ3≥…λp≥0及對(duì)應(yīng)的單位特征向量μ1,μ2,μ3,…μp
(2)計(jì)算因子載荷a(ij),得到因子載荷陣A
4.根據(jù)特征根λ大小確定公因子F個(gè)數(shù),選出公因子(選λ>1的為公因子)4.根據(jù)特征根λ大小確定公因子F個(gè)數(shù),選出公因子(選λ>1的為公因子)
5.計(jì)算共同度和方差貢獻(xiàn)率
Xi的變量共同度為因子載荷矩陣A中第i行元素的平方和;因子變量Fj的方差貢獻(xiàn)為因子載荷矩陣A中第j列各元素的平方和。
6.因子旋轉(zhuǎn),得出旋轉(zhuǎn)后的成分矩陣(這個(gè)手算太可怕,不知道要用正交陣去乘因子載荷陣多少次,所以一般用SPSS導(dǎo)出吧。。。)
7.計(jì)算因子得分
用SPSS導(dǎo)出的結(jié)果中,
【成分矩陣】就是初始的 因子載荷陣A?。?!
具體步驟和分析道理,可見(jiàn)百度文庫(kù)一篇文
鏈接:因子分析的基本思想、基本步驟、數(shù)學(xué)模型及求解
自己的問(wèn)題自己回答o(╯□╰)o,總之就醬啦~希望給后來(lái)人一個(gè)小借鑒吧。。。
【知乎用戶的回答(0票)】:
估計(jì)載荷矩陣有很多方法,有些方法需要迭代。因子載荷分布極化也需要大量迭代。
【盧酒的回答(0票)】:
多年以前學(xué)的,詳細(xì)解答步驟在多元分析的課本里有,題主可以去細(xì)看看書,當(dāng)年期末考的題全部都是手算,在中國(guó)筆試考試中理想化簡(jiǎn)單化的題目沒(méi)有什么是我們做不到……
原文地址:知乎
聯(lián)系客服