本文用于比較六個(gè)不同統(tǒng)計(jì)軟件程序(SAS,Stata,HLM,R,SPSS和Mplus)的兩級(jí)分層線性模型的過程和輸出。
下面介紹的六個(gè)模型都是兩級(jí)分層模型的變體,也稱為多級(jí)模型,這是混合模型的特殊情況。此比較僅對(duì)完全嵌套的數(shù)據(jù)有效(不適用于交叉或其他設(shè)計(jì)的數(shù)據(jù),可以使用混合模型進(jìn)行分析)。盡管HLM軟件的網(wǎng)站聲明可以用于交叉設(shè)計(jì),但這尚未得到確認(rèn)。下面的SAS,Stata,R,SPSS和Mplus中使用的過程是其多層次或混合模型過程的一部分,并且可以擴(kuò)展為非嵌套數(shù)據(jù)。
但是出于比較的目的,我們將僅研究完全嵌套的數(shù)據(jù)集。除了HLM(完全由GUI運(yùn)行)以外,所有程序的下面都包含用于每個(gè)模型的代碼/語(yǔ)法。我們提供了HLM和SPSS的屏幕截圖。此外,每個(gè)模型均以分層格式和混合格式指定。盡管模型的這兩個(gè)表達(dá)式是等效的,但一些研究領(lǐng)域更傾向于可視化層次結(jié)構(gòu),因?yàn)樗菀卓吹綄哟沃g的分離,而另一些研究領(lǐng)域則更喜歡混合格式,在其中容易區(qū)分固定效果和隨機(jī)效果。
模型注意事項(xiàng)將預(yù)測(cè)變量添加到本文檔討論的六個(gè)模型中時(shí),我們選擇以均值居中為中心,這意味著我們從每個(gè)受試者的得分中減去了該變量的總體均值。
正如Enders&Tofighi(2007)所詳細(xì)討論的那樣,以總體平均值為中心,而不是以組平均值(每個(gè)組的平均值均以該組中受試者的得分為準(zhǔn))為中心,并不適合所有模型。。使用哪種居中方法的選擇應(yīng)由所詢問的具體研究問題決定。另一個(gè)考慮因素是這些程序使用的估計(jì)方法來產(chǎn)生參數(shù)估計(jì),即最大似然(ML)或受限最大似然(REML)。每種都有自己的優(yōu)點(diǎn)和缺點(diǎn)。ML更適合不平衡的數(shù)據(jù),但是會(huì)產(chǎn)生偏差的結(jié)果。REML是無偏的,但是在將兩個(gè)嵌套模型與似然比檢驗(yàn)進(jìn)行比較時(shí),不能使用REML。
兩種方法將產(chǎn)生相同的固定效應(yīng)估計(jì),但它們對(duì)隨機(jī)效應(yīng)的估計(jì)卻有所不同(Albright&Marinova,2010)。正如我們將在下面討論的模型中看到的那樣,這兩種方法產(chǎn)生的結(jié)果非常相似,并且不會(huì)極大地影響隨機(jī)因素的p值。但是,重要的是要意識(shí)到,方法的選擇會(huì)影響隨機(jī)因素的估計(jì),標(biāo)準(zhǔn)誤差和p值,并且可能會(huì)影響宣布隨機(jī)因素是否重要的決策。SAS,HLM,R和SPSS默認(rèn)使用REML,而Stata和Mplus使用ML。在本文檔中的Stata示例中,我們告訴Stata使用REML以便將輸出與其他四個(gè)程序進(jìn)行比較。
我們還報(bào)告了每種模型的類內(nèi)相關(guān)系數(shù)(ICC)ρ。ICC是結(jié)果變量中方差的比例,由分層模型的分組結(jié)構(gòu)解釋。它是根據(jù)組級(jí)別誤差方差與總誤差方差之比來計(jì)算的:
其中,是2級(jí)殘差的方差,是1級(jí)殘差的方差。換句話說,與總的無法解釋的方差(方差之內(nèi)和之間)相比,ICC報(bào)告了模型中任何可歸因于分組變量的預(yù)測(cè)變量無法解釋的變化量。
流行的數(shù)據(jù)集由來自不同班級(jí)的學(xué)生組成,并且由于每個(gè)學(xué)生都屬于一個(gè)唯一的班級(jí),因此它是一個(gè)嵌套設(shè)計(jì)。因變量是“流行”,它是一個(gè)自評(píng)的流行度,范圍為0-10。預(yù)測(cè)指標(biāo)包括學(xué)生級(jí)別的性別(二分法)和Extrav(連續(xù)的自我評(píng)價(jià)的外向得分),以及班級(jí)的Texp(多年的老師經(jīng)驗(yàn), 是連續(xù)的)。
無條件混合模型規(guī)范類似于單因素方差分析,其總體均值和類效應(yīng)。但是,我們將其視為隨機(jī)效應(yīng)(均值為零的正態(tài)分布變量),而不是像方差分析中那樣的固定因子效應(yīng)。因此,我們將估計(jì)值解釋為每個(gè)類別的平均數(shù)在總體平均人氣得分附近的方差。
估算值是每個(gè)班級(jí)的“大眾”平均值的平均值,而不是研究中所有學(xué)生的平均值。如果數(shù)據(jù)完全平衡(即每個(gè)班級(jí)的學(xué)生人數(shù)相同),則無條件模型的結(jié)果將與方差分析程序的結(jié)果相同。
需要“ covtest”選項(xiàng)來報(bào)告方差分量估計(jì)的標(biāo)準(zhǔn)誤差。另外, 需要指定非結(jié)構(gòu)化協(xié)方差矩陣類型,這是HLM和R默認(rèn)情況下使用的類型,我們?cè)谶@里使用它進(jìn)行比較。SAS的輸出等于Hox的書表2.1中的結(jié)果。我們可以得出結(jié)論,各類別之間的平均人氣得分為5.078,并且各類別之間的差異(1.221)比不同類別之間的差異(0.702)多。當(dāng)我們?yōu)樵撃P陀?jì)算ICC時(shí),將對(duì)此進(jìn)行進(jìn)一步討論。
Stata的xtmixed命令需要因變量,后跟“ ||” 指定固定變量和隨機(jī)變量之間的分隔。我們必須包括方差選項(xiàng)以查看輸出中方差分量的估計(jì)值,以及reml選項(xiàng)以使用受限的最大似然估計(jì)。還要注意,Stata不會(huì)輸出隨機(jī)分量估計(jì)的p值,但是可以通過置信區(qū)間中是否包含零來確定有效值。這些結(jié)果與SAS的結(jié)果完全匹配
HLM報(bào)告方差組件的標(biāo)準(zhǔn)偏差,而不是標(biāo)準(zhǔn)誤差。同樣,對(duì)于隨機(jī)效應(yīng),他 僅報(bào)告截距的卡方統(tǒng)計(jì)量和p值。這些結(jié)果與其他程序的結(jié)果相同。
R報(bào)告方差成分(例如HLM)的標(biāo)準(zhǔn)偏差,而lme4軟件包報(bào)告固定效應(yīng)的t統(tǒng)計(jì)量。
屏幕截圖:
需要在“隨機(jī)”窗口中指定非結(jié)構(gòu)化協(xié)方差類型。這些結(jié)果與其他程序和本文得出的結(jié)果相同。請(qǐng)注意,像SAS和Mplus一樣,SPSS報(bào)告方差分量的標(biāo)準(zhǔn)誤差,而HLM和R報(bào)告標(biāo)準(zhǔn)差。我們無法得出結(jié)論,哪個(gè)更適合報(bào)告,但是差異不會(huì)影響這些參數(shù)的p值。
因?yàn)檫@是一個(gè)無條件模型,所以我們不需要指定任何WITHIN或BETWEEN變量。下面列出了在MODEL語(yǔ)句中列出變量的標(biāo)準(zhǔn)。在以下各節(jié)中,我們將看到前三個(gè)示例:
1.%WITHIN%– 1級(jí)固定因子(非隨機(jī)斜率)2.具有潛在斜率變量的%WITHIN%– 1級(jí)隨機(jī)因子3.%BETWEEN%– 2級(jí)固定因子4.在任一個(gè)陳述–在學(xué)生水平上測(cè)得的變量,但具有1級(jí)和2級(jí)方差估計(jì) 。
上表顯示了Mplus輸出底部的“模型結(jié)果”部分的結(jié)果。Mplus確實(shí)會(huì)報(bào)告每個(gè)估計(jì)的p值,并且所有估計(jì)都與其他程序的p值匹配,但隨機(jī)截距的方差估計(jì)相差約0.007。這種差異是由于Mplus使用ML估計(jì)這一事實(shí)造成的。盡管存在這種差異,但我們看不到任何變量的重要性發(fā)生變化。
總體而言,這六個(gè)程序?qū)τ趦H截取模型產(chǎn)生了非常相似的結(jié)果(唯一的差異發(fā)生在隨機(jī)效應(yīng)的Mplus估計(jì)中)。唯一的區(qū)別是他們?nèi)绾螆?bào)告隨機(jī)方差估計(jì)的精度。此模型的ICC等于:
這告訴我們,“流行”課程總變化的大約三分之一可以由每個(gè)學(xué)生所在的班級(jí)解釋。
該模型增加了一個(gè)學(xué)生級(jí)別的固定因子Extrav,即自我報(bào)告的外向得分。混合模型看起來像是基于帶有協(xié)變量Extrav的類的ANCOVA,但請(qǐng)記住,我們?nèi)匀徽J(rèn)為這是隨機(jī)效應(yīng),而不是固定效應(yīng)。因此, 估算值與ANCOVA程序所得出的估算值不同。
在此數(shù)據(jù)的實(shí)際應(yīng)用中,Extrav應(yīng)該具有固定的效果而不是隨機(jī)的效果是沒有意義的,因?yàn)閷W(xué)生外向性的水平應(yīng)隨班級(jí)而變化。但是,出于比較這四個(gè)程序的目的,我們?nèi)匀幌M{(diào)查一個(gè)具有一個(gè)學(xué)生級(jí)別固定因子的案例。
現(xiàn)在,我們對(duì)Extrav的固定效果進(jìn)行了估算。學(xué)生報(bào)告的外向得分每增加一個(gè)單位,他們的受歡迎度得分就會(huì)增加0.486。這些結(jié)果等于使用REML的其他程序的結(jié)果。
當(dāng)我們向Stata中的模型添加預(yù)測(cè)變量時(shí),我們添加了cov(un)選項(xiàng),指定了非結(jié)構(gòu)化協(xié)方差矩陣。我們將 Extraversion變量放在“ ||”之前 表示它是一個(gè)固定因子(具有非隨機(jī)斜率)。這些結(jié)果與其他程序的結(jié)果相同。
現(xiàn)在,我們?cè)赩ARIABLE語(yǔ)句的WITHIN選項(xiàng)中包括居中的Extrav變量。對(duì)于內(nèi)部MODEL規(guī)范,我們必須使用“ ON”選項(xiàng),以告知Mplus Extrav是固定的1級(jí)因子。 可以看到由于使用ML估計(jì)而不是REML,許多估計(jì)和估計(jì)的標(biāo)準(zhǔn)誤差(以及t統(tǒng)計(jì)量)存在細(xì)微差異。由于方差的估計(jì)值與其他程序不同,因此Mplus報(bào)告的ICC與下面報(bào)告的有所不同。
對(duì)于此模型,前五個(gè)程序的結(jié)果完全相同,而Mplus的估算值相差很小。此模型的ICC大于無條件模型的ICC(正如預(yù)期的那樣,因?yàn)槲覀兺ㄟ^添加固定因子來控制某些學(xué)生水平的變化):
使用一個(gè)學(xué)生水平的固定因子,“流行”總變化的幾乎一半可以由該學(xué)生的班級(jí)和學(xué)生水平的固定因子“外向”解釋
該模型包含Extrav的隨機(jī)斜率,這意味著我們?cè)试S回歸方程的斜率隨類而變化。該模型比以前的模型更適合于所使用的變量,因?yàn)榭梢灾庇^地假設(shè)外向因類而異。
隨機(jī)Extrav斜率的估計(jì)值很重要(p值為0.003),因此我們可以說學(xué)生的外向性得分隨班級(jí)的不同而變化。這些結(jié)果與其他程序的結(jié)果完全匹配,除了固定效果的t統(tǒng)計(jì)量存在一些細(xì)微差異。
這次我們?cè)赪ITHIN語(yǔ)句中包括一個(gè)潛在的斜率變量,以將Extrav指定為隨機(jī)因子,該變量告訴Mplus不要在數(shù)據(jù)集中尋找“ randoms1”,因?yàn)闆]有觀察到它??梢詫⒋俗兞康妮敵鼋忉尀镋xtrav的隨機(jī)斜率分量。我們必須這樣做,因?yàn)镸plus是為結(jié)構(gòu)方程模型設(shè)計(jì)的,其多級(jí)模型功能是其潛在潛伏分析程序的改編。
總體而言,前五個(gè)程序?qū)υ撃P彤a(chǎn)生相同的結(jié)果,而Mplus再次由于ML估計(jì)而相差很小。此模型的ICC為:
通過將Extrav的影響從固定變?yōu)殡S機(jī),由于我們正在考慮在學(xué)生級(jí)別上更多隨機(jī)變化,因此ICC會(huì)略有增加。
對(duì)于此模型,我們包括第二個(gè)學(xué)生級(jí)別的變量Sex,該變量也具有隨機(jī)斜率。這意味著我們既要考慮學(xué)生的性別,又要考慮他們的外向得分,并且允許這兩個(gè)因素的斜率隨班級(jí)而變化。
在此輸出中,我們可以看到性別確實(shí)對(duì)學(xué)生自我報(bào)告的知名度有重大影響(p值<0.001)。對(duì)Sex的固定估計(jì)意味著,在Extrav不變的情況下,女學(xué)生(Sex = 1)的普遍得分比男學(xué)生(基線組,Sex = 0)高1.244。
SAS不喜歡在該模型中,Sex的估計(jì)方差非常接近零,因此沒有輸出標(biāo)準(zhǔn)誤差或p值。因?yàn)榉浅=咏诹?,所以我們可以得出結(jié)論,性別不會(huì)因類別而顯著變化。
Stata在運(yùn)行該模型時(shí)引用了一個(gè)錯(cuò)誤:標(biāo)準(zhǔn)誤差計(jì)算失敗,這意味著未計(jì)算隨機(jī)效應(yīng)的標(biāo)準(zhǔn)誤差。我們發(fā)現(xiàn)通過刪除cov(un)選項(xiàng),不會(huì)出現(xiàn)此錯(cuò)誤。但是,該輸出中的所有估計(jì)均與其他程序不同,因此我們選擇使用非結(jié)構(gòu)化協(xié)方差矩陣規(guī)范報(bào)告輸出。我們不確定這是否是在Stata中運(yùn)行此類模型的常見問題,但重要的是要意識(shí)到它會(huì)發(fā)生。
這些估計(jì)大致等于其他計(jì)劃的結(jié)果,但隨機(jī)性別影響的估計(jì)除外。由于這種影響非常接近于零,因此程序不會(huì)報(bào)告完全相同的值,但是所有結(jié)果都表明該值遠(yuǎn)非重要。
這次,我們?cè)赪ITHIN語(yǔ)句中包括了兩個(gè)潛在的斜率變量,以將Extrav和Sex指定為隨機(jī)因子。我們可以將“ randoms1”的輸出解釋為Extrav的估計(jì),將“ randoms2”的輸出解釋為Sex的估計(jì)。
Mplus針對(duì)此模型的輸出所得出的估計(jì)值與先前模型中的其他程序相距甚遠(yuǎn)。我們看到,由于模型必須估計(jì)更多隨機(jī)參數(shù),因此估計(jì)程序(ML與REML)之間的差異變得更加明顯。但是,Mplus同意其他程序的觀點(diǎn),即“性別”的隨機(jī)方差部分以外的所有估計(jì)值都非常重要。
對(duì)于方差非常接近零的隨機(jī)效應(yīng),六個(gè)程序以不同的方式處理估計(jì)值。SAS和Stata無法報(bào)告隨機(jī)效應(yīng)的標(biāo)準(zhǔn)誤差或p值,而其他變量的估計(jì)值和標(biāo)準(zhǔn)誤差均具有相當(dāng)大的差異。Mplus結(jié)果也顯示出比以前的模型更大的差異。此模型的ICC為:
同樣,當(dāng)我們?cè)谀P椭刑砑恿硪粋€(gè)學(xué)生級(jí)別的效果(包括隨機(jī)斜率)時(shí),ICC略有增加。
這是我們看到的第一個(gè)具有2級(jí)(班級(jí))變量的模型:教師的多年經(jīng)驗(yàn)(Texp),也是以均值為中心的。正如Enders和Tofighi(2007)指出的那樣,級(jí)別2變量的唯一居中選項(xiàng)是均值居中。 無法對(duì)均值中心Texp進(jìn)行分組,因?yàn)樗呀?jīng)在班級(jí)水平上進(jìn)行了度量,這意味著“分組均值”將等于原始值。
在分層格式中, 可以看到它具有固定的斜率系數(shù),并且對(duì)于每個(gè)類j都是唯一的。該模型在教師的經(jīng)驗(yàn)和學(xué)生水平的變量之間沒有任何相互作用。如果我們有理由相信Texp不會(huì)緩和Sex和Extrav對(duì)Popular的影響,那么我們將使用此模型,這意味著我們的學(xué)生水平變量的斜率是相同的,無論學(xué)生是否有新教師或新教師。一位擁有多年經(jīng)驗(yàn)的人。
現(xiàn)在,我們?cè)诠潭ㄐЧ碇锌吹搅薚exp,估計(jì)值為0.089,p值很大。這意味著,在使學(xué)生的性別和性取向得分保持不變的情況下,每增加一年的教師經(jīng)驗(yàn),該學(xué)生的熱門得分就會(huì)增加0.089。
同樣,我們看到SAS無法處理隨機(jī)性別效應(yīng)的很小變化。因此,沒有報(bào)告標(biāo)準(zhǔn)誤差,z統(tǒng)計(jì)量或p值。
與以前的模型一樣,我們收到一個(gè)錯(cuò)誤,告訴我們Stata無法計(jì)算方差分量的標(biāo)準(zhǔn)誤差。但是,這些估計(jì)值與其他程序的估計(jì)值大致相同。
這些估計(jì)值與其他程序的結(jié)果略有不同。
對(duì)于Level-2因子,我們?cè)贐ETWEEN語(yǔ)句中包括Ctexp。我們?cè)俅慰吹竭@些估計(jì)數(shù)與其他五個(gè)計(jì)劃的輸出有微小出入
使用REML的五個(gè)程序的輸出實(shí)質(zhì)上是相等的,僅相差幾千個(gè)單位。與以前的模型一樣,最大的差異出現(xiàn)在隨機(jī)性別效應(yīng)的方差估計(jì)中,因?yàn)樗浅=咏恪?/p>
請(qǐng)注意,此模型的ICC比以前的模型有所降低(= 0.542):
請(qǐng)記住,ICC是衡量 所在的班級(jí)可以解釋多少無法解釋的變化的方法。通過添加班級(jí)級(jí)別的預(yù)測(cè)變量,我們可以解釋不同班級(jí)中較大比例的變化。因此,與沒有任何2級(jí)預(yù)測(cè)變量的模型相比,該模型的隨機(jī)截距存在較少的變異,因此ICC也較低。
這是我們?cè)诎嗉?jí)變量Texp與學(xué)生級(jí)變量Sex和Extrav之間進(jìn)行跨級(jí)交互的唯一模型。例如,如果我們想找出具有更多經(jīng)驗(yàn)的教師是否比新教師對(duì)學(xué)生的外向性或性別與他們自我報(bào)告的知名度之間的關(guān)系有不同的影響,則可以使用此模型。換句話說,教師的經(jīng)歷是否適度了性格外向或性別對(duì)受歡迎程度的影響?
可以看到,在分層格式中,Texp在三個(gè)方程式的每個(gè)方程式內(nèi)都有一個(gè)斜率系數(shù)。這與混合模型中的交互項(xiàng)有關(guān),即通過外向的教師體驗(yàn)和按性別的教師體驗(yàn)。
在固定效果表中,有兩個(gè)交互作用項(xiàng),其中一個(gè)()遠(yuǎn)不重要,p值> 0.5。
在隨機(jī)方差分量表中,我們看到外向隨機(jī)斜率的估計(jì)值和性別隨機(jī)斜率的估計(jì)值與零沒有顯著差異。這意味著沒有證據(jù)表明這兩個(gè)因素實(shí)際上在該模型中因類別而異。
Stata無法自動(dòng)識(shí)別變量之間的交互項(xiàng),因此我們必須為兩個(gè)跨級(jí)別的交互手動(dòng)創(chuàng)建變量(請(qǐng)參見上面的代碼中的gen語(yǔ)句)。當(dāng)我們使用帶有非結(jié)構(gòu)化協(xié)方差矩陣選項(xiàng)的xtmixed命令運(yùn)行時(shí),Stata給出了一個(gè)錯(cuò)誤,指出Hessian不是負(fù)半定性,一致性錯(cuò)誤,并且沒有產(chǎn)生任何輸出。
這些估計(jì)值大致等于其他程序的結(jié)果。
對(duì)于SPSS 19而言,此模型實(shí)在太多了。對(duì)于具有非結(jié)構(gòu)化協(xié)方差矩陣的更復(fù)雜的模型,其他程序可能會(huì)運(yùn)行更有效的算法,因此優(yōu)于SPSS。
現(xiàn)在,我們?cè)贐ETWEEN模型部分中包含兩個(gè)ON語(yǔ)句,以指示與教師經(jīng)驗(yàn)的跨層次交互。同樣,我們發(fā)現(xiàn)與其他輸出之間的細(xì)微差異,但Mplus同意Texp和Sex之間的固定交互作用不顯著,而Extrav和Sex的隨機(jī)組成也并不重要。
加上兩個(gè)跨層交互項(xiàng),Stata和SPSS無法使用非結(jié)構(gòu)化協(xié)方差選項(xiàng)運(yùn)行模型。這并不是說不應(yīng)該將它們用于這種類型的分析,但是在向具有非結(jié)構(gòu)化協(xié)方差矩陣的模型中添加更復(fù)雜的參數(shù)時(shí),應(yīng)謹(jǐn)慎使用。
與以前的模型一樣,SAS,HLM和R的結(jié)果相對(duì)接近相等,而Mplus的估計(jì)略有不同。另外,ICC與模型5幾乎完全相同,這意味著交互作用項(xiàng)不會(huì)改變按類別說明的差異比例:
進(jìn)行比較的目的是調(diào)查來自六個(gè)不同統(tǒng)計(jì)軟件程序的嵌套兩級(jí)層次模型的過程和結(jié)果可能存在的差異??傮w而言,我們發(fā)現(xiàn)SAS,Stata(帶有reml選項(xiàng)),HLM,R和SPSS產(chǎn)生的實(shí)際估計(jì)值之間沒有太大差異。Mplus使用另一種估算方法ML,這導(dǎo)致其估算值與其他估算值有所不同。另外,重要的是要注意以下幾點(diǎn):
1.對(duì)于方差估計(jì)非常接近零的隨機(jī)效應(yīng),SAS無法產(chǎn)生標(biāo)準(zhǔn)誤差或p值。其他三個(gè)程序在估計(jì)這些參數(shù)方面的差異與其他效果相比更大。
2. Stata和SPSS無法處理最復(fù)雜的模型,該模型包含兩個(gè)跨級(jí)別的交互項(xiàng)。建議使用其他程序來分析復(fù)雜模型并指定非結(jié)構(gòu)化協(xié)方差矩陣。
此外,我們研究了每種模型中類內(nèi)相關(guān)系數(shù)的值。通過添加1級(jí)預(yù)測(cè)因子,ICC有所增加。但是,當(dāng)我們添加2級(jí)預(yù)測(cè)變量時(shí),ICC會(huì)大大降低,甚至比無條件模型更低。這是由于在類級(jí)別添加了預(yù)測(cè)變量時(shí),無法解釋的Level-2變異(隨機(jī)截距項(xiàng))減少了。
盡管本文檔可以用作為嵌套數(shù)據(jù)集運(yùn)行各種兩級(jí)分層模型的指南,但我們強(qiáng)烈建議讀者僅在適合回答您的特定研究問題時(shí)使用這些模型。在確定固定因素和隨機(jī)因素之間,以及對(duì)于中心平均值為1的總體平均值或組平均值時(shí),必須謹(jǐn)慎使用。
Enders, Craig K. and Tofighi, Davood (2007). “Centering Predictor Variables in Cross-Sectional Multilevel Models: A New Look at an Old Issue.” Psychological Methods, vol. 12, pg. 121-138.
Hox, Joop J. (2010). Multilevel Analysis (2nd ed.). New York: Routledge
聯(lián)系客服