工欲善其事,必先利其器。從事定量研究能夠熟練的使用統(tǒng)計(jì)軟件是必不可少的技能。那么,面對(duì)這么多的軟件,該如何選擇的?本期推送就針對(duì)SPSS、Stata、R語言、SAS、Python等軟件進(jìn)行一個(gè)詳細(xì)的測(cè)評(píng)。
SPSS
SPSS(Statistical Product Service Solutions)軟件,是目前社會(huì)科學(xué)領(lǐng)域最常見的統(tǒng)計(jì)分析軟件,也是世界上最早的統(tǒng)計(jì)分析軟件,于1968年研究開發(fā)成功,2009年7月28日,IBM公司收購統(tǒng)計(jì)分析軟件提供商SPSS公司。如今SPSS的最新版本為27,而且更名為IBM SPSS Statistics。迄今,SPSS公司已有40余年的成長歷史。
軟件操作難度:0難度,SPSS的操作是基于鼠標(biāo)點(diǎn)擊的,并且SPSS目前有漢化版本,只要按照菜單欄提示進(jìn)行點(diǎn)擊即可。單純從軟件操作上毫無難度,但是如果你不會(huì)操作原因是因?yàn)椴恢涝撌褂煤畏N方法,是統(tǒng)計(jì)學(xué)基礎(chǔ)的問題。
零基礎(chǔ)入門難度:非常容易
優(yōu)點(diǎn):操作簡單,鼠標(biāo)點(diǎn)擊
缺點(diǎn):輸出的結(jié)果較為冗雜,有用的、沒用的所有結(jié)果都給你列出來,研究者需要進(jìn)行篩選。付費(fèi)使用,價(jià)格較高;對(duì)于最前沿方法的更新?lián)Q代已經(jīng)很難跟上潮流了。
推薦指數(shù):兩顆星(適合本科生和碩士生從事簡單的定量研究)
Stata
Stata是1985年由美國計(jì)算機(jī)資源中心研制統(tǒng)計(jì)分析軟件,每兩年更新一版,最新為第17版。也是當(dāng)下使用的較為廣泛的統(tǒng)計(jì)軟件。
軟件操作難度:稍微有一點(diǎn)難度,主要是因?yàn)?/span>Stata相比于SPSS不是鼠標(biāo)點(diǎn)擊操作,而是需要輸入“代碼”、“命令”來執(zhí)行相關(guān)內(nèi)容,和我們?nèi)粘J褂秒娔X具有一定差異。所以剛開始可能會(huì)覺得不習(xí)慣
零基礎(chǔ)入門難度:略有難度
優(yōu)點(diǎn):應(yīng)用廣泛,從基礎(chǔ)到前沿各類方法比較完整,而且因?yàn)槭褂玫挠脩魯?shù)量多,各類教材、教程等也很多。
缺點(diǎn):付費(fèi)使用,價(jià)格較高
適用人群:基本適合定量研究的所有需求。
R語言
R是統(tǒng)計(jì)領(lǐng)域廣泛使用的誕生于1980年左右的S語言的一個(gè)分支??梢哉J(rèn)為R是S語言的一種實(shí)現(xiàn)。而S語言是由AT&T貝爾實(shí)驗(yàn)室開發(fā)的一種用來進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析和作圖的解釋型語言。最初S語言的實(shí)現(xiàn)版本主要是S-PLUS。S-PLUS是一個(gè)商業(yè)軟件,它基于S語言,并由MathSoft公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。后來新西蘭奧克蘭大學(xué)的Robert Gentleman和Ross Ihaka及其他志愿人員開發(fā)了一個(gè)R系統(tǒng)。由“R開發(fā)核心團(tuán)隊(duì)”負(fù)責(zé)開發(fā)。R可以看作貝爾實(shí)驗(yàn)室(AT&T BellLaboratories)的Rick Becker、John Chambers和Allan Wilks開發(fā)的S語言的一種實(shí)現(xiàn)。當(dāng)然,S語言也是S-Plus的基礎(chǔ)。所以,兩者在程序語法上可以說是幾乎一樣的,可能只是在函數(shù)方面有細(xì)微差別,程序十分容易地就能移植到一程序中,而很多一的程序只要稍加修改也能運(yùn)用于R。
軟件操作難度:R是完全依靠代碼進(jìn)行數(shù)據(jù)分析的,并且R的代碼寫起來要比Stata相對(duì)復(fù)雜一點(diǎn),更貼近純粹的計(jì)算機(jī)代碼,對(duì)于格式的要求相對(duì)較高。
零基礎(chǔ)入門難度:難度較大
優(yōu)點(diǎn):免費(fèi)使用。在統(tǒng)計(jì)學(xué)原理方面非常嚴(yán)謹(jǐn),例如某一變量一旦被定義為類別型,就無法計(jì)算均值,這在其他軟件里都是可以的,而R在這方面是非常嚴(yán)謹(jǐn)?shù)摹?/span>R語言有一個(gè)最大的優(yōu)點(diǎn)是可以多個(gè)數(shù)據(jù)同時(shí)操作,而其他軟件只能一次打開一個(gè)數(shù)據(jù),如果處理多個(gè)數(shù)據(jù)集R的優(yōu)勢(shì)很明顯。
缺點(diǎn):入門難度較大
適用人群:基本適合定量研究的所有需求,以及有更前沿需求的
其他軟件
SAS可能也是大家經(jīng)常聽說的軟件,但是在國內(nèi)社會(huì)科學(xué)研究領(lǐng)域的應(yīng)用比較少,一方面因?yàn)樗鞘召M(fèi)軟件,國內(nèi)較難找到破解版;另一方面其操作難度相對(duì)較大。并且運(yùn)行SAS軟件對(duì)電腦硬件也有一定的要求,并不是所有電腦都能成功啟動(dòng)SAS的
Python也是最近幾年的“網(wǎng)紅”,Python雖然可以實(shí)現(xiàn)統(tǒng)計(jì)分析的工作,但畢竟不是專業(yè)的統(tǒng)計(jì)分析軟件,在定量研究的使用上還是比較吃力的,因而如果大家為了做數(shù)據(jù)分析去學(xué)習(xí)Python可能有些事倍功半了,除非遇到超大數(shù)據(jù)集,其他軟件無法打開的情況可能會(huì)動(dòng)用到Python,但這種情況可能少之又少,如果大到R或者Stata都無法打開的數(shù)據(jù),可能一般的電腦硬件配置都無法滿足了。
Excel是大家再熟悉不過的了,也有很多人會(huì)吹捧Excel有多強(qiáng)大,但是無論如何吹捧它都有固有的缺陷,不然也不會(huì)有其他軟件的產(chǎn)生。對(duì)于從事定量研究的人來講,想用Excel做數(shù)據(jù)分析基本是開玩笑,但是要熟練地掌握應(yīng)用Excel作圖等數(shù)據(jù)描述中需要的功能。雖然,其他軟件可以輸出圖形,但是目前國內(nèi)很多期刊對(duì)于投稿圖表的要求依然是Excel
聯(lián)系客服