如何撰寫(xiě)經(jīng)濟(jì)學(xué)應(yīng)用論文
Marc F.Bellemare[1]
2020年9月7日
摘要:
如何寫(xiě)出好的學(xué)術(shù)論文?盡管許多經(jīng)濟(jì)學(xué)者本能地知道如何做到這一點(diǎn),但很少有人花時(shí)間思考如何撰寫(xiě)好的研究論文,即使是最成功的經(jīng)濟(jì)學(xué)者也往往很難清楚地回答這個(gè)問(wèn)題。其原因在于兩:經(jīng)濟(jì)學(xué)家讀的內(nèi)容(what economists read)以及他們讀的方式(how they read it)。本文的目的是告訴讀者如何撰寫(xiě)最終能發(fā)表在同行評(píng)議期刊上的應(yīng)用經(jīng)濟(jì)學(xué)論文。本文將盡可能詳細(xì)地討論論文的各組成部分,并以常規(guī)的研究項(xiàng)目中各部分呈現(xiàn)的順序來(lái)編排。
關(guān)鍵詞:應(yīng)用經(jīng)濟(jì)學(xué),應(yīng)用微觀(guān)經(jīng)濟(jì)學(xué),方法論
JEL 分類(lèi)號(hào): A2, B4
“我相信,我們成為什么樣的人,取決于我們的父親在空閑的時(shí)刻教我們什么,當(dāng)他們不想教我們的時(shí)候。我們是由一點(diǎn)點(diǎn)智慧組成的。”
— Umberto Eco(1988),Foucault’s Pendulum.
1引言
一部好電影會(huì)讓你忘記你是正在看一部電影。同樣,一篇好的研究論文會(huì)讓你忘記你是正在讀一篇研究論文。作者們介紹了他們所做的工作:他們問(wèn)了自己什么問(wèn)題,他們是如何回答的,他們是如何確保自己的答案是可靠的??傊?,我們可以從他們的研究中學(xué)到一些東西,以用于指導(dǎo)政府或商業(yè)決策。
但正如一部好電影讓你沉浸在它創(chuàng)造的世界中,讓你忘記制作過(guò)程中使用的各種主題和技巧一樣,一篇好的研究論文也會(huì)讓你忘記它的整體結(jié)構(gòu)以及作者使用的各種修辭手段。
你如何寫(xiě)一篇好的研究論文?根據(jù)我的經(jīng)驗(yàn),大多數(shù)研究經(jīng)濟(jì)學(xué)家花在思考這個(gè)問(wèn)題上的時(shí)間太少,即使是最成功的經(jīng)濟(jì)學(xué)家也很難清晰地回答同一個(gè)問(wèn)題。
這既與經(jīng)濟(jì)學(xué)家的閱讀內(nèi)容有關(guān),也與他們的閱讀方式有關(guān)。
關(guān)于經(jīng)濟(jì)學(xué)家所閱讀的內(nèi)容,大多數(shù)研究生課程(如行為、發(fā)展、產(chǎn)業(yè)組織、勞動(dòng))的教學(xué)大綱通常包含閱讀所研究領(lǐng)域的優(yōu)秀論文。這些論文影響了該領(lǐng)域研究人員的思維方式以及他們對(duì)該主題的了解。例如,發(fā)展經(jīng)濟(jì)學(xué)課程的教學(xué)大綱幾乎肯定會(huì)將Foster and Rosenzweig(1995)和Suri(2011)的文章包含在其技術(shù)采用主題下的閱讀清單。因?yàn)?,在該領(lǐng)域中,這兩篇文章被廣泛認(rèn)為是最好的文獻(xiàn)之一。
這主要適用于低年級(jí)的讀者(因?yàn)楦呒?jí)別的學(xué)者可能在審稿時(shí)接觸到很多質(zhì)量不高的文章),但只閱讀最好的論文也是一把雙刃劍。平心而論,閱讀那些來(lái)自于我們同行們關(guān)注話(huà)題的論文時(shí),我們會(huì)獲得最大的收獲。同時(shí),這些論文往往是質(zhì)量最高的,即在某一特定話(huà)題中最接近完美的論文[2]。但是,如果一個(gè)人所讀的都是完美的論文,那么他就很難了解好論文是怎么形成的。例如,再拿電影舉例,如果你所看的都是英國(guó)電影協(xié)會(huì)(British film Institute,BFI)有史以來(lái)最偉大的50部電影名單上的電影,而你從未看過(guò)任何糟糕(甚至是一般)的電影,那么你將很難發(fā)現(xiàn)到底是什么讓這些電影躋身BFI前50名。
關(guān)于經(jīng)濟(jì)學(xué)家的閱讀方式,大多數(shù)研究生課程的教學(xué)大綱經(jīng)常列出大量的文章,從而使研究生迅速掌握出一種技能,即Mortimer Adler在其著作How to Read a Book中談到的“檢視閱讀”(inspectional reading)。在閱讀學(xué)術(shù)論文時(shí),檢查閱讀包括閱讀引言、查看方法和結(jié)果,以及(可能)在閱讀的下一篇文章之前閱讀結(jié)論。以這種方式閱讀論文可以幫助一個(gè)人了解某一主題的內(nèi)容,但這并不是學(xué)習(xí)如何撰寫(xiě)好論文的秘訣[3]。
當(dāng)經(jīng)濟(jì)學(xué)家知道如何寫(xiě)出一篇好的研究論文時(shí),他們通常會(huì)以非結(jié)構(gòu)化、無(wú)意識(shí)的方式收集這些信息,通常是從顧問(wèn)、資深同事和合作者的閑聊中收集的。換句話(huà)說(shuō),正如本文開(kāi)篇Umberto Eco所說(shuō)的一樣:他們“在偶然的時(shí)刻……通過(guò)一點(diǎn)點(diǎn)知識(shí)”學(xué)到了這一點(diǎn),而這些顧問(wèn)、同事和合著者并沒(méi)有試圖教他們。
因此,本文的目標(biāo)是教會(huì)讀者如何撰寫(xiě)最終將在同行評(píng)議期刊上發(fā)表的應(yīng)用經(jīng)濟(jì)學(xué)論文[4]。為了做到這一點(diǎn),研究論文的各個(gè)組成部分將盡可能詳細(xì)地討論,文章的順序大致以各組成部分在實(shí)際研究工作中的順序來(lái)編排[5]。
本文的其余部分組織如下。第2節(jié)列出并討論了一篇典型的應(yīng)用經(jīng)濟(jì)學(xué)論文結(jié)構(gòu)。第3節(jié)解釋了如何呈現(xiàn)應(yīng)用論文的理論框架,記住理論經(jīng)濟(jì)學(xué)家很少讀應(yīng)用論文。接下來(lái)是論文中真正應(yīng)用的部分:第4節(jié)解釋如何呈現(xiàn)數(shù)據(jù)和描述性統(tǒng)計(jì),第5節(jié)解釋如何呈現(xiàn)實(shí)證框架,第6節(jié)解釋如何討論實(shí)證結(jié)果,包括其局限性。第7節(jié)解釋了如何寫(xiě)出正確的結(jié)論。因?yàn)橹挥挟?dāng)作者弄清楚自己研究的結(jié)果是什么以及它們的意思后才能完成標(biāo)題、摘要和引言的寫(xiě)作,所以第8節(jié)才解釋了如何選擇一個(gè)好的標(biāo)題、寫(xiě)一個(gè)好的引言和摘要。第9節(jié)討論了文獻(xiàn)綜述和背景部分(并非是論文中必須有的部分)。第10節(jié)討論了有關(guān)發(fā)表的事宜。第11節(jié)是總結(jié)。
2結(jié)構(gòu)
在創(chuàng)作任何類(lèi)型的作品之前,了解這些作品的典型結(jié)構(gòu)是什么樣的,并寫(xiě)下這種結(jié)構(gòu)的粗略草圖是有幫助的。從最抽象的意義上說(shuō),典型的經(jīng)濟(jì)學(xué)論文(無(wú)論是否是應(yīng)用論文)的結(jié)構(gòu)如下:
1.標(biāo)題
2.摘要
3.引言
4. ……
5.總結(jié)和結(jié)束語(yǔ)
6.參考文獻(xiàn)
根據(jù)你寫(xiě)的論文的類(lèi)型,第四部分將會(huì)有所改變。由于本文主要探討應(yīng)用論文的寫(xiě)作,所以上面的結(jié)構(gòu)通常會(huì)被修改為如下結(jié)構(gòu):
1.標(biāo)題
2.摘要
3.引言
4.理論框架
5.數(shù)據(jù)和描述性統(tǒng)計(jì)
6.經(jīng)驗(yàn)框架
7.結(jié)果和討論
8.摘要和結(jié)束語(yǔ)
9.參考文獻(xiàn)
10.附錄
該結(jié)構(gòu)并不是一成不變的。有些作者會(huì)調(diào)換第5部分和第6部分的位置,從而使實(shí)證框架部分位于數(shù)據(jù)和描述性統(tǒng)計(jì)部分之前。類(lèi)似地,一篇研究常規(guī)問(wèn)題的論文(例如,更強(qiáng)的財(cái)產(chǎn)權(quán)對(duì)農(nóng)業(yè)生產(chǎn)力的影響)可能根本不需要一個(gè)理論框架,因?yàn)檫@個(gè)問(wèn)題背后的理論是眾所周知的,而且還是教科書(shū)上的東西?;蛘撸谝灾髸?huì)有一部分介紹重要的研究背景,而這部分既不適合放在引言,也不適合放在描述性統(tǒng)計(jì)部分。
雖然有些論文可能需要對(duì)上述結(jié)構(gòu)進(jìn)行大幅度調(diào)整,但是熟悉常規(guī)的結(jié)構(gòu)還是有幫助的。在這種情況下,一個(gè)很好的類(lèi)比就是:在爵士樂(lè)傳奇人物John Coltrane制作 A Love Supreme(1965)(至高無(wú)上的愛(ài),一部很前衛(wèi)的作品)之前,他首先學(xué)會(huì)了Blue Train(1957)中波普爵士樂(lè)結(jié)構(gòu)(較為僵化和傳統(tǒng))。
這對(duì)應(yīng)用經(jīng)濟(jì)學(xué)家意味著什么?這意味著在你打破常規(guī)之前,必須學(xué)會(huì)它們。因此,在考慮寫(xiě)一篇一般讀者幾乎認(rèn)不出的結(jié)構(gòu)的論文之前,一個(gè)應(yīng)用經(jīng)濟(jì)學(xué)家應(yīng)該確保已經(jīng)寫(xiě)了足夠多遵循以上結(jié)構(gòu)的論文。換句話(huà)說(shuō),更有經(jīng)驗(yàn)的研究人員才能做出結(jié)構(gòu)上的改變,因?yàn)樗麄儚淖x者那里積累了足夠的善意,這允許他們稍作改變。
本文的其余部分將不遵循剛才給出的結(jié)構(gòu)。雖然對(duì)我來(lái)說(shuō),寫(xiě)一篇論文,其后續(xù)章節(jié)的標(biāo)題按照確切的結(jié)構(gòu)順序排列肯定會(huì)更容易,但事實(shí)證明,我們?cè)谡撐闹兴故镜慕Y(jié)構(gòu)往往與我們實(shí)際工作的結(jié)構(gòu)相差較大。
3理論框架
由于應(yīng)用經(jīng)濟(jì)學(xué)的目標(biāo)通常是回答這樣的問(wèn)題:“x影響y嗎?”或者“如果x增加一個(gè)單位,y會(huì)改變多少個(gè)單位?”,因此經(jīng)濟(jì)學(xué)中的大多數(shù)應(yīng)用工作都是從某種變化理論(theory of change)的思想開(kāi)始的。
雖然許多影響評(píng)估報(bào)告會(huì)包含一項(xiàng)具體措施是否以及如何影響無(wú)數(shù)結(jié)果,但最好的研究論文往往側(cè)重于單個(gè)問(wèn)題(例如,“擁有土地所有權(quán)如何影響農(nóng)業(yè)生產(chǎn)力?”)或特定問(wèn)題背后的影響機(jī)制(例如,“土地所有權(quán)提高農(nóng)業(yè)生產(chǎn)力,其原因是土地所有權(quán)允許土地所有者將其土地用作抵押品嗎?”),因此,首先必須決定一篇特定文章將側(cè)重于何種利益因果關(guān)系。換句話(huà)說(shuō),最好的應(yīng)用經(jīng)濟(jì)學(xué)文章往往只關(guān)注一個(gè)問(wèn)題,所以你幾乎不可避免地不得不在剪裁室的地板上留下一些材料[6]。
那么,問(wèn)題是如何將你的變化理論轉(zhuǎn)化為應(yīng)用經(jīng)濟(jì)學(xué)文章的適當(dāng)理論框架。這里有兩種可能的情況:你正在研究一個(gè)理論家已經(jīng)研究過(guò)變化理論的問(wèn)題,或者你正在研究一個(gè)理論家還沒(méi)有研究過(guò)變化理論的問(wèn)題。
在第一個(gè)場(chǎng)景中,有兩個(gè)選項(xiàng)。第一種選擇是在文章中包含一個(gè)理論框架,通過(guò)合并或改編他人的理論框架。盡管研究論文常常讓人覺(jué)得必須在所有方面進(jìn)行創(chuàng)新,但這種情況很少發(fā)生。尤其是應(yīng)用論文,重要的是研究問(wèn)題、實(shí)證策略或兩者都是新穎的。在大多數(shù)情況下,使用別人的理論框架是完全可以的——前提是你清楚地說(shuō)明你正在這樣做。
一個(gè)密切相關(guān)的選擇是調(diào)整別人的理論框架來(lái)滿(mǎn)足你的需求——例如,通過(guò)合并一個(gè)額外的變量,或者通過(guò)做出額外的假設(shè)來(lái)滿(mǎn)足你的應(yīng)用需求。
在第二種情況下,當(dāng)你在研究一個(gè)理論家還沒(méi)有研究過(guò)變化理論的問(wèn)題時(shí),你必須清楚地陳述你的變化理論。在某些情況下,這可能需要一個(gè)正式的理論模型。在其他情況下,僅僅提出一個(gè)口頭的概念框架就足夠了[7]。在所有情況下,你的理論框架——無(wú)論是數(shù)學(xué)的還是口頭的——都應(yīng)該從基本元素開(kāi)始,并做出必要的假設(shè),以產(chǎn)生“X通過(guò)機(jī)制m引起y”的結(jié)果,不能多也不能少。
一個(gè)人可以寫(xiě)一整本關(guān)于如何寫(xiě)經(jīng)濟(jì)理論的書(shū)(有些人已經(jīng)寫(xiě)過(guò)了;參見(jiàn)Thomson,2011),因此除了以下內(nèi)容之外,關(guān)于這個(gè)話(huà)題本文就不再多說(shuō)了:寫(xiě)經(jīng)濟(jì)學(xué)理論模型是一種藝術(shù)形式,如果你在研究生階段還沒(méi)有學(xué)過(guò)如何寫(xiě),也許最好與有過(guò)這種經(jīng)歷的人合作。在發(fā)表應(yīng)用經(jīng)濟(jì)學(xué)文章時(shí),最好是一個(gè)非正式的、不規(guī)范的概念框架,而不是一個(gè)糟糕的正式理論模型。
也就是說(shuō),即使你的工作論文包含了一個(gè)簡(jiǎn)明的理論模型,有時(shí)也會(huì)發(fā)生這樣的情況:即審稿人或編輯會(huì)要求你在論文發(fā)表前刪除你的理論模型,或者將該理論模型放在附錄中。如果發(fā)生這種情況,要知道這是常見(jiàn)的,不要感覺(jué)被冒犯。從這個(gè)意義上說(shuō),在你的論文中有一個(gè)理論框架通常只是一個(gè)信號(hào)(in the Spence, 1973 sense),表明你知道自己在做什么。Job-Market Paper尤其如此,其除了要對(duì)現(xiàn)有研究做出貢獻(xiàn)外,還應(yīng)被用來(lái)展示作者各方面的能力。
4數(shù)據(jù)和描述性統(tǒng)計(jì)
在發(fā)展了你的變化理論之后,你大概正在尋找數(shù)據(jù)來(lái)檢驗(yàn)理論。與編寫(xiě)正式理論模型一樣,以下這些書(shū)描寫(xiě)了有關(guān)數(shù)據(jù)收集的注意事項(xiàng)(調(diào)查數(shù)據(jù)見(jiàn)Deaton,1997或Glewwe and Grosh,2000;隨機(jī)對(duì)照試驗(yàn)見(jiàn)Gerber and Green,2012或Glennerster and Takavarasha,2013),因此本節(jié)將不討論數(shù)據(jù)來(lái)自哪里,而是假設(shè)您有這些數(shù)據(jù)。本節(jié)將側(cè)重于如何在應(yīng)用經(jīng)濟(jì)學(xué)文章的正文中呈現(xiàn)數(shù)據(jù)。
數(shù)據(jù)和描述性統(tǒng)計(jì)部分回答了讀者關(guān)于數(shù)據(jù)本身的所有問(wèn)題。具體來(lái)說(shuō),一個(gè)好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分需要首先討論數(shù)據(jù)的來(lái)源,包括數(shù)據(jù)收集的時(shí)間,搜集人員,構(gòu)成樣本的觀(guān)察數(shù)據(jù)是如何選擇納入的(即調(diào)查方法,或區(qū)域、社區(qū)、家庭、個(gè)人等是如何選擇的),樣本代表什么人群,目標(biāo)樣本量是多少以及如何確定樣本量(例如,通過(guò)功率計(jì)算),實(shí)際樣本量是多少,無(wú)答復(fù)率是多少,如果數(shù)據(jù)是縱向的,損耗率是多少,如何處理缺失值(例如,是否只是刪除了觀(guān)測(cè)值,或是否對(duì)某些值進(jìn)行了插補(bǔ),如果是,如何進(jìn)行插補(bǔ))。廣義地說(shuō),這里提供的信息允許讀者判斷論文中所包含結(jié)果的外部有效性(有時(shí)也可以判斷它們的內(nèi)部有效性,當(dāng)數(shù)據(jù)存在損失時(shí)就是如此),或者如何將這些結(jié)果用于樣本外預(yù)測(cè)。
在介紹了這些基礎(chǔ)知識(shí)之后,一個(gè)好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分通過(guò)精確和簡(jiǎn)明地解釋它們測(cè)量的東西以及它們測(cè)量的方法來(lái)介紹論文中使用的所有變量(所有變量都在論文中有用到)。例如,在發(fā)展中國(guó)家的許多農(nóng)村地區(qū),人們的收入來(lái)源多種多樣。因此,如果“收入”包括在分析中,讀者需要被告知收入來(lái)源是什么。
這可能看起來(lái)很乏味,但它包含了重要的信息(如果作為作者的你都覺(jué)得很乏味,你可以想象它對(duì)讀者來(lái)說(shuō)是什么感覺(jué))。例如,農(nóng)業(yè)發(fā)展文獻(xiàn)中的一個(gè)古老問(wèn)題,也是我做了相當(dāng)多研究工作的一個(gè)話(huà)題:參與農(nóng)業(yè)價(jià)值鏈(通過(guò)合約式農(nóng)業(yè),作為種植戶(hù))是否會(huì)讓參與的家庭過(guò)得更好(參見(jiàn)Bellemare and Bloem,2018年的綜述)。這通常是通過(guò)在家庭是否參與合約式農(nóng)業(yè)的虛擬模型上回歸家庭收入的度量(作為福利的代理變量)來(lái)評(píng)估的。然而,如果不知道家庭收入的組成部分是什么,就不可能知道它是否包括來(lái)自合約式農(nóng)業(yè)(contract farming)的收入。當(dāng)家庭收入包含合約式農(nóng)業(yè)收入時(shí),存在明顯的反向因果關(guān)系問(wèn)題。而當(dāng)家庭收入不包含合約式農(nóng)業(yè)收入時(shí),反向因果關(guān)系問(wèn)題要小得多。
好消息是,當(dāng)人們獲得用于收集數(shù)據(jù)的調(diào)查問(wèn)卷時(shí),提取出這些信息是相對(duì)容易的,而且?guī)缀蹩偸沁@樣。此外,呈現(xiàn)這種信息的最好方法是創(chuàng)建變量描述表,其中每一行都是之后用于分析的變量,第一列給出該變量的名稱(chēng)(括號(hào)中是度量單位),第二列給出精確的度量。圖1就是一個(gè)這樣的表。這樣可以通過(guò)簡(jiǎn)潔的方式呈現(xiàn)大量必要的信息,從而最大限度地減少讀者的不滿(mǎn):那些想要了解數(shù)據(jù)的人可以閱讀該表,而那些不想了解的人可以跳過(guò)表來(lái)關(guān)注變量名。
圖1變量描述示例(Bellemare,2012)
在介紹了上述內(nèi)容之后,現(xiàn)在是介紹和討論描述性統(tǒng)計(jì)的時(shí)候了。雖然在過(guò)去僅僅展示平均值和標(biāo)準(zhǔn)差就已足夠,但當(dāng)處理變量為類(lèi)別變量時(shí),有必要展示平衡檢驗(yàn)的結(jié)果。表中每一行都是用于分析的變量,平均值和標(biāo)準(zhǔn)差是以處理狀態(tài)為條件顯示的,其中通過(guò)報(bào)告組間均值差異的p值來(lái)評(píng)估各變量的均值是否在不同處理狀態(tài)下有顯著的不同。盡管教科書(shū)上的例子涉及兩種處理狀態(tài)——處理和控制——但越來(lái)越多的研究包括兩種以上的處理組(treatment arms),因此任何有意義的平衡測(cè)試都必須報(bào)告每一組組間差異檢驗(yàn)。對(duì)于兩個(gè)處理組,這意味著三種情況,即處理組1與對(duì)照組,處理組2與對(duì)照組,和處理組1與處理組2。
利用經(jīng)驗(yàn)數(shù)據(jù),這種平衡測(cè)試是向讀者展示隨機(jī)化的操作是適當(dāng)?shù)?。?duì)于觀(guān)察數(shù)據(jù),我們不會(huì)期望數(shù)據(jù)是平衡的,做平衡測(cè)試的目的是評(píng)估數(shù)據(jù)的不平衡程度——這一想法來(lái)自相關(guān)的文獻(xiàn)(Morgan and Winship,2015)。在處理組和對(duì)照組之間完全隨機(jī)分配的情況下,小于10%統(tǒng)計(jì)顯著水平的成對(duì)比較差異應(yīng)少于10個(gè),小于20%統(tǒng)計(jì)顯著水平的成對(duì)比較差異應(yīng)少于20個(gè),小于1%統(tǒng)計(jì)顯著水平的成對(duì)比較差異應(yīng)少于100個(gè)。如果對(duì)比結(jié)果報(bào)告了太多系統(tǒng)性差異,那么在估計(jì)效果時(shí),理想情況下應(yīng)該在回歸或匹配上下文匹配中控制相關(guān)協(xié)變量。
除了通常的平均數(shù)和標(biāo)準(zhǔn)差表以及一個(gè)或多個(gè)顯示平衡測(cè)試結(jié)果的表之外,良好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分還可以用于非參數(shù)地探索數(shù)據(jù),其具體方法是:當(dāng)相關(guān)變量連續(xù)時(shí),顯示相關(guān)變量的核密度估計(jì)(即至少包括處理和控制變量,但控制也可能是異質(zhì)性處理效應(yīng)來(lái)源的因素);當(dāng)相關(guān)變量是類(lèi)別變量時(shí),展示相關(guān)變量的直方圖;或當(dāng)處理變量和結(jié)果都是啞變量時(shí),顯示交叉表(即二乘二表)。
在編寫(xiě)數(shù)據(jù)和描述性統(tǒng)計(jì)部分時(shí),應(yīng)該避免幾個(gè)重要的錯(cuò)誤。第一個(gè)這樣的錯(cuò)誤是寫(xiě)出了一個(gè)平淡無(wú)奇的手段列舉。如果性別變量?jī)H被用為控制變量,那么陳述“37.4%的受訪(fǎng)者是女性”就沒(méi)有什么意義,因?yàn)樽x者可以自行查找;這里唯一值得討論的變量通常是因變量和自變量以及任何用于識(shí)別的變量(例如,工具變量或驅(qū)動(dòng)變量(forcing variable)),或任何真正重要的變量。通常,一個(gè)很好的經(jīng)驗(yàn)法則是將描述性統(tǒng)計(jì)的討論保持在幾句話(huà)之內(nèi)。
第二個(gè)這樣的錯(cuò)誤是在討論數(shù)據(jù)和描述性統(tǒng)計(jì)時(shí)使用了過(guò)去式。上面的例子說(shuō)明了“37.4%的受訪(fǎng)者是女性”,而不是“37.4%的受訪(fǎng)者過(guò)去是女性”。在使用英語(yǔ)進(jìn)行科學(xué)交流時(shí),使用現(xiàn)在時(shí)討論數(shù)據(jù)或結(jié)果是更有效。正如應(yīng)該避免使用被動(dòng)語(yǔ)態(tài)一樣,也應(yīng)該避免使用過(guò)去時(shí)態(tài),除非是在總結(jié)和結(jié)束語(yǔ)中。
最后,另一個(gè)錯(cuò)誤是,呈現(xiàn)的數(shù)字要么因?yàn)樘《刑嗟男?shù)位(通常,三位小數(shù)就足夠了,而且無(wú)論如何,總是可以通過(guò)縮放一個(gè)變量,使其大小與其他變量的大小相適應(yīng)),要么在表格中呈現(xiàn)了難以解釋的數(shù)字,如1.37e+8,或者任何讀者不熟悉的單位(例如,如果需要,總是可以用幾千或幾十萬(wàn)來(lái)表示美元金額)。換句話(huà)說(shuō),即使在實(shí)際回歸中,使用的是收入的對(duì)數(shù),但描述性統(tǒng)計(jì)表也應(yīng)該報(bào)告收入水平的平均值,而不是收入對(duì)數(shù)的平均值。
最后,盡管數(shù)據(jù)和描述性統(tǒng)計(jì)部分中的許多內(nèi)容好像是無(wú)用的裝腔作勢(shì),但是正如前面所說(shuō)的那樣,一個(gè)好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分應(yīng)該可以讓讀者對(duì)因果關(guān)系的符號(hào)和大小形成合理預(yù)期,并了解在給定的條件作用域中,這種關(guān)系可能如何變化。
5實(shí)證框架
在討論數(shù)據(jù)并呈現(xiàn)描述性統(tǒng)計(jì)數(shù)據(jù)后,你通常會(huì)轉(zhuǎn)向討論你的實(shí)證框架,即你所使用的實(shí)證研究設(shè)計(jì)。
一個(gè)實(shí)證框架由兩個(gè)相關(guān)的部分組成:(一)估計(jì)策略(即估計(jì)什么,如何估計(jì),以及如何進(jìn)行統(tǒng)計(jì)推斷),和(二)識(shí)別策略(即什么樣的數(shù)據(jù)特征允許做出因果陳述,或者如果這不可能,我們?nèi)绾沃牢覀冋诮咏龀鲞@樣的陳述)。
5.1估計(jì)策略
估計(jì)策略通常包括為回答研究問(wèn)題而估計(jì)的方程式。雖然精明的讀者可以通過(guò)查看論文中的表格來(lái)回顧論文中的估計(jì)方程,但這并不總是可能的。無(wú)論如何,讀者應(yīng)該做的工作量應(yīng)該保持在最低限度,因此提出待估算的方程式在很大程度上是簡(jiǎn)潔的。
理想情況下,這些方程將盡可能簡(jiǎn)約。雖然一個(gè)回歸可能包括10到15個(gè)控制變量,但最好將所有這些都放入控制變量的向量X中。在一個(gè)估計(jì)框架中,什么樣的變量值得在方程中顯示出來(lái)?首先,因變量(y)、處理變量(D或T)、控制向量(X)、截取項(xiàng)()和誤差項(xiàng)()應(yīng)該一起包括在內(nèi)。
最好遵循以下幾個(gè)范式,順序不分先后:
· 從最?。ɡ鐐€(gè)人)到最大(例如區(qū)域),所有變量都應(yīng)有適當(dāng)?shù)南聵?biāo),通常標(biāo)為等。
· 拉丁字母表示變量。希臘字母表示系數(shù)。
· 在估計(jì)策略部分中,如果同一個(gè)等式使用在了不同的情況下,那么系數(shù)也應(yīng)該有不同的下標(biāo)。換句話(huà)說(shuō),如果β被用來(lái)表示y對(duì)D的回歸系數(shù),那么它就不應(yīng)該被再用來(lái)表示y對(duì)D和x的回歸中的系數(shù)——這兩個(gè)的意思并不相同,用來(lái)表示它們的符號(hào)也應(yīng)該不同。最好給每個(gè)系數(shù)加上數(shù)字下標(biāo):在前一種情況下,D的系數(shù)將被表示為β,而在后一個(gè)情況中則是β1。也可以在每個(gè)系數(shù)上加上字母下標(biāo),例如βr和βs可以分別表示同一系數(shù)在簡(jiǎn)約式(reduced-form)和結(jié)構(gòu)式(structural-form)中的估計(jì)系數(shù)。
· 估計(jì)策略部分還應(yīng)具體說(shuō)明用什么方法來(lái)進(jìn)行估計(jì)。我們通常對(duì)感興趣,但可以用許多不同的方法來(lái)估計(jì),如參數(shù)、半?yún)?shù)或非參數(shù)方法。當(dāng)結(jié)果變量為啞變量時(shí),讀者需要知道是否使用了線(xiàn)性概率模型、probit或logit模型。在不明確的情況下,還需要指定估計(jì)量(例如,最小二乘、最大似然或廣義矩量法)。
· 在介紹了可估計(jì)的方程之后,應(yīng)該討論相關(guān)的假設(shè)檢驗(yàn)。在形如下列的回歸式中
· 估計(jì)策略部分還需要討論推斷,即標(biāo)準(zhǔn)誤差是否穩(wěn)健以及如何穩(wěn)健(如果是,對(duì)什么穩(wěn)健;如果使用Huber-sandwich-White校正,僅僅說(shuō)標(biāo)準(zhǔn)誤差是穩(wěn)健的是不夠的,但有必要說(shuō)它們對(duì)異方差是穩(wěn)健的),它們是否以及如何被聚類(lèi)(如果是,在什么水平上聚類(lèi)以及為什么聚類(lèi);請(qǐng)參見(jiàn)Abadie et al.,2017),以及是否使用抽樣權(quán)重來(lái)使樣本更接近感興趣的人群(如果是,它們是如何構(gòu)造的;參見(jiàn)Solon et al.,2015)。
5.2識(shí)別策略
在呈現(xiàn)和討論估計(jì)方程后,有必要討論如何識(shí)別與因果關(guān)系判斷有關(guān)的系數(shù)。
隨著時(shí)間的推移,“識(shí)別”一詞經(jīng)歷了幾種含義(Lewbel,2019)。不管怎樣,“識(shí)別”一詞在當(dāng)前的應(yīng)用論文中經(jīng)常指因果判斷。什么是因果判斷?它指的是:一個(gè)系數(shù)不僅僅反映了因變量y和一些的變量D之間的部分相關(guān),而是反映了一種因果關(guān)系。
雖然一個(gè)無(wú)偏系數(shù)估計(jì)意味著因果關(guān)系的系數(shù)估計(jì),但不能反過(guò)來(lái)這樣說(shuō)。事實(shí)上,在某些情況下,雖然人們知道一個(gè)系數(shù)是有偏的,但在統(tǒng)計(jì)上顯著的系數(shù)估計(jì)仍然可以用來(lái)表示因果關(guān)系。
例如,假設(shè)變量D是連續(xù)且隨機(jī)賦值的,同時(shí)你有結(jié)果變量y和控制向量X的數(shù)據(jù)。試想一下,受試者完全符合D,那么原則上你就可以估計(jì)平均處理效果(ATE)。但變量D的衡量是有誤差的,即當(dāng)輸入數(shù)據(jù)D時(shí),就會(huì)存在一定程度的誤差[8]。在這種情況下,當(dāng)被拒絕時(shí),我們?nèi)匀豢梢哉f(shuō),我們發(fā)現(xiàn)了D對(duì)y的因果關(guān)系影響,并提示說(shuō),這種影響是偏向于零的(或者,我們可以說(shuō),我們估計(jì)了實(shí)際影響的絕對(duì)值的下限)。有時(shí),即使變量D存在著系統(tǒng)性測(cè)量誤差,還是可以這樣說(shuō),因?yàn)樵谀承┣闆r下,系統(tǒng)性測(cè)量誤差會(huì)導(dǎo)致的估計(jì)值偏向于零,但這種情況要少見(jiàn)得多。
如果你足夠幸運(yùn),即在你的處理變量中有實(shí)驗(yàn)性的變化,以及平行趨勢(shì)檢驗(yàn)表明處理組和對(duì)照組是隨機(jī)分配的,你的識(shí)別策略部分可以很短,因?yàn)槟阃ㄟ^(guò)隨機(jī)分配實(shí)現(xiàn)了對(duì)因果關(guān)系的判斷。換句話(huà)說(shuō),你可以估計(jì)Pearl(2009)所指的,即x對(duì)y的影響。
如果你的處理變量中有實(shí)驗(yàn)性的變化,但平行趨勢(shì)檢驗(yàn)表明處理組和對(duì)照組的觀(guān)測(cè)值并不是隨機(jī)分配的,你的識(shí)別策略部分也可以很短,因?yàn)槟阒恍枰忉屓绾瓮ㄟ^(guò)添加控制變量,來(lái)糾正這種情況,但只是在某種程度上,因?yàn)楫?dāng)可觀(guān)察到的不平衡時(shí),不可觀(guān)察到的也可能不平衡。
如果處理變量中沒(méi)有實(shí)驗(yàn)性的變化,那么就有很多工作需要完成。為了簡(jiǎn)潔起見(jiàn),本文不能也不會(huì)用觀(guān)測(cè)數(shù)據(jù)對(duì)因果關(guān)系進(jìn)行深入研究(如果想要閱讀完整的介紹,請(qǐng)參見(jiàn)Morgan and Winship,2015)。然而,一個(gè)好的識(shí)別策略還是需要討論一些必要的內(nèi)容。
· 直觀(guān)地解釋為什么你的結(jié)果可以用來(lái)解釋因果關(guān)系。實(shí)際上,這意味著你必須告訴你的讀者,為什么你的結(jié)果可以做出比以往更準(zhǔn)確的因果判斷。
· 在最好的情況下,這是因?yàn)槟阌幸粋€(gè)研究設(shè)計(jì)(例如,一個(gè)嚴(yán)格外生的工具變量,如彩票),其可以實(shí)現(xiàn)隨機(jī)分配的作用(即隨機(jī)分組)。在不太理想的情況下(例如,一個(gè)看似外生的工具變量;參見(jiàn)Conley et al.,2012),你需要解釋為什么,即使你沒(méi)有做出干凈明確的因果關(guān)系判斷,但你的結(jié)果是現(xiàn)有文獻(xiàn)中最好的[9]。
· 依次討論以下三種內(nèi)生性問(wèn)題的來(lái)源:反向因果、遺漏變量、測(cè)量誤差,解釋這些內(nèi)生性問(wèn)題在你的研究中是否非常關(guān)鍵,以及你是如何處理這些內(nèi)生性問(wèn)題的。如果這里的確有問(wèn)題,請(qǐng)大膽承認(rèn)它們,并解釋它們對(duì)你的估計(jì)系數(shù)將帶來(lái)什么樣的偏差。不要謊稱(chēng)你的論文能做什么以及不能做什么!
· 做到這點(diǎn)后,還需要考慮另一個(gè)問(wèn)題,即違反SUTVA(個(gè)體處理穩(wěn)定性假設(shè))。SUTVA的含義是如果你想研究對(duì)的影響,其中i表示單個(gè)個(gè)體,t表示時(shí)間,那么的值必須不能影響、或的值,即只能影響。然而SUTVA可能非常難滿(mǎn)足。也就是說(shuō),人們可以經(jīng)常檢驗(yàn)是否違反了SUTVA假定;參見(jiàn)Burke et al.(2019)的論文,作者們很好地處理了違反SUTVA的問(wèn)題。
· 由于這是極其重要的,因此在強(qiáng)調(diào)一次:如果你并沒(méi)有發(fā)現(xiàn)因果關(guān)系,不要謊稱(chēng)你的論文能做什么以及不能做什么!編輯和審稿人更愿意處理那些作者坦率地承認(rèn)其文章局限性的稿件,而不是那些作者試圖欺騙讀者的稿件。簡(jiǎn)單地說(shuō):前一種稿件比后一種稿件被接受的機(jī)會(huì)要大得多。
[1] Northrop Professor, Department of AppliedEconomics, and Director, Center for International Food and Agricultural Policy,University of Minnesota, 1994 Buford Avenue, Saint Paul, MN 55108, Web:http://www.marcfbellemare.com, Email: mbellema@umn.edu.
[2]也就是說(shuō),如果每個(gè)人都讀同一篇論文,而沒(méi)有讀其他論文,一個(gè)不健康的群體思維動(dòng)態(tài)(an unhealthygroup-think dynamic)就會(huì)在研究某一特定主題的學(xué)者中形成,這可能會(huì)導(dǎo)致多年的學(xué)術(shù)努力浪費(fèi)在回答錯(cuò)誤的問(wèn)題上,或試圖用錯(cuò)誤的方法來(lái)回答問(wèn)題。
[3]了解是成功的一半,因此了解許多讀者會(huì)仔細(xì)閱讀你的論文可以讓你成為一個(gè)更有效的作者,因?yàn)檫@會(huì)迫使你在撰寫(xiě)引言、方法和結(jié)果部分以及結(jié)論時(shí)投入更多的思考。如果你知道許多讀者不太愿意閱讀,比如背景部分,那么你就應(yīng)該在介紹部分陳述該部分最重要的內(nèi)容。在論文中漏掉重要信息是非常嚴(yán)重的失誤。學(xué)術(shù)作家所犯的第二大罪過(guò)是委托讀者(commission),其包括迫使讀者在論文中尋找特定的信息。而讀者時(shí)間成本很高,因此普通讀者更可能放棄閱讀該論文,而非自行尋找信息。當(dāng)一個(gè)相對(duì)初級(jí)的學(xué)者(如博士生或助理教授)為了給更高級(jí)的讀者(如教師顧問(wèn)、期刊編輯或期刊審稿人)留下深刻印象而寫(xiě)作時(shí),尤其如此。
[4]雖然我主要指的是在談到“應(yīng)用論文”時(shí),通過(guò)簡(jiǎn)化形式的方法來(lái)評(píng)估興趣因果關(guān)系的文章,但本文中的許多建議適用于其他類(lèi)型的實(shí)證論文,如描述性或結(jié)構(gòu)性論文。
[5] “研究項(xiàng)目”指的是回答給定研究問(wèn)題的整個(gè)研究過(guò)程,從想法到發(fā)表。
[6]這并不是說(shuō)一篇論文不可以同時(shí)研究幾個(gè)問(wèn)題。但最好是詳細(xì)地回答一個(gè)單一的、相對(duì)狹窄的研究問(wèn)題。多余的和無(wú)關(guān)的研究最好不要放在論文之中。
[7]一種可能是在沒(méi)有數(shù)學(xué)的情況下,用語(yǔ)言進(jìn)行理論論證,并將數(shù)學(xué)留在附錄中。例如,見(jiàn)《桑切斯·德·拉·塞拉》(2020)。
[8]正如一位同事所指出的,如果D是二進(jìn)制的,任何測(cè)量誤差都不可能是經(jīng)典的,因?yàn)樗^(guān)察到的D將與D的真值負(fù)相關(guān)。
[9]這假定你的研究設(shè)計(jì)必須是最好的。如果您的研究設(shè)計(jì)并不是最好的話(huà),除非你顯著提高了外部有效性,否則你需要向下調(diào)整你的目標(biāo)期刊集。
原文:
翻譯:王聰 高楷博
審核:涂盟
參考文獻(xiàn)
聯(lián)系客服