黃匡時 中國人口與發(fā)展研究中心副研究員
六普總和生育率1.18是“直接匯總”的 2012年4月,由中國統(tǒng)計出版社出版的《中國2010年人口普查資料》(下冊)第2100頁表6-3中公布了全國育齡婦女分年齡、孩次的生育狀況(2009.11.1-2010.10.31)。此表包括年齡別的平均育齡婦女和年齡別的出生人數(shù)以及年齡別的生育率。社會各界根據(jù)總和生育率的概念和計算方法由此表匯總出總和生育率為1.18。而且根據(jù)表6-3a、表6-3b和標(biāo)6-3c分別可以匯總出城市總和生育率(0.89)、鎮(zhèn)總和生育率(1.16)和鄉(xiāng)村總和生育率(1.44)。 社會上不少人由此認定,2010年我國總和生育率為1.18,并由此推斷出一些危言聳聽的結(jié)論。事實上,國家統(tǒng)計局并沒有在其他場合正式公布總和生育率,而且在公布2010年人口普查數(shù)據(jù)的時候特別做了說明,“按照通常做法,資料中的數(shù)據(jù)為人口普查直接登記的匯總結(jié)果,未做任何誤差校正。根據(jù)事后質(zhì)量抽查,2010年人口普查人口漏登率為0.12%,總體質(zhì)量較高。但有些指標(biāo)(如出生人口、死亡人口和按分年齡婦女生育率計算的總和生育率)現(xiàn)場登記難度較大,漏登率要相對高一些,請讀者使用普查相關(guān)數(shù)據(jù)時,應(yīng)考慮不同指標(biāo)登記誤差因素的影響。”因此,學(xué)者在使用普查數(shù)據(jù)的時候應(yīng)對“資料使用說明” 有了充分的了解。 國家統(tǒng)計局之所以公布年齡別生育率數(shù)據(jù)也是盡可能滿足國人對生育率數(shù)據(jù)總量和結(jié)構(gòu)的需求,也是情理之中,而且也對數(shù)據(jù)用戶做了溫馨的提示。根據(jù)“資料使用說明”,我們知道,根據(jù)計算機直接匯總的總和生育率是存在較大漏登的。生育的漏登率至少比0.12%要高。盡管國家統(tǒng)計局并沒有告訴具體漏登率,但是我們根據(jù)《中國2010年人口普查資料》表1-12《各地區(qū)分性別、月份的出生人口(2009.11.1-2010.10.31)》(第188頁)和表3-1《全國分年齡、性別的人口》(第265頁)可以大致了解一些。 表3-1《全國分年齡、性別的人口》(第265頁)給出了0歲-100歲的人口數(shù),其中,0歲人口數(shù)為13786434人,1歲人口數(shù)為15657955人。我國知道,普查時間是2010年11月1日,也就是說,0歲組的人口數(shù)是2009年11月1日到2010年10月31日出生的,而1歲組的人口數(shù)是2008年11月1日到2009年10月31日出生的。這兩個數(shù)都不是自然年的概念。所以,我們不能說2010年的出生人口就是0歲組的13786434人。要計算2010年的出生人口數(shù)還需要考慮月份的情況。而表1-12《各地區(qū)分性別、月份的出生人口(2009.11.1-2010.10.31)》恰好給出了出生的月度分布。根據(jù)表1-12,可以得知,2009年11月1日到2010年10月31日的出生人口數(shù)為13836187人。如果我們假定2010年11月和12月的出生人口數(shù)與2009年11月和12月一致,那我們可以初步認為,2010年的出生人口數(shù)為13836187人,比0歲年齡組的人口數(shù)13786434人略多49753人??紤]到月度出生數(shù)要比將0歲年齡組人口數(shù)視為出生數(shù)更為科學(xué),因此我們采用分月出生匯總數(shù)視為2010年的出生數(shù)。 如果按照2010年出生人口數(shù)為13836187人來計算,采用同樣的年齡別生育分布(即表6-3中全國育齡婦女分年齡、孩次的生育狀況)來計算,全國的總和生育率為1.28。所以說總和生育率1.18是低估的,是受到漏登扭曲后的直接匯總結(jié)果。如果按照總和生育率為1.18來核算,2010年出生人口數(shù)為1289萬人,與1384萬相差較大。 2010年的總和生育率約在1.5左右 那么,根據(jù)出生月份數(shù)匯總核算的總和生育率為1.28是否就是真實的生育水平呢?當(dāng)然不是。我們知道,國家統(tǒng)計局公布的《中國2010年人口普查資料》中的“資料使用說明”說的很清楚,出生漏登率要相對高一些。根據(jù)中國人口出版社出版的《人口與計劃生育常用數(shù)據(jù)手冊》(2016)第165頁,2010年的出生人口數(shù)大約在1592萬人,如果按著1289萬來計算,漏登率達到23.51%,如果按照1384萬來核算,2010年的出生人口數(shù)漏登率達到15.06%。 2010年出生人口數(shù)為1592萬是根據(jù)國家統(tǒng)計局公布的2010年的粗出生率乘以2010年的平均人口數(shù)計算而來的,即11.9‰×[(134091 133450)/2]=1592萬。由此可見,國家統(tǒng)計局對2010年的出生人口數(shù)的判斷是1592萬,而不是總和生育率為1.18所對應(yīng)的1289萬和根據(jù)出生月份匯總的1384萬。也正因為如此,國家統(tǒng)計局在公布2010年普查資料的時候在“資料使用說明”中特意提醒用戶在使用出生數(shù)據(jù)的時候要注意漏報問題。 聯(lián)合國世界人口展望2017年修訂版估計,2010年出生人口總數(shù)為1724萬人,對應(yīng)的粗出生率為12.7‰,總和生育率為1.59。聯(lián)合國人口司世界人口展望2017年修訂版基于中國歷次人口普查數(shù)據(jù)對歷史人口數(shù)據(jù)進行了修正,可能更加符合中國實際。
圖1 2010年直接匯總結(jié)果和按照出生月份人數(shù)以及粗出生率核算的年齡別生育率
從2010年的1.18到2015年的1.05
既然2010年總和生育率是“直接匯總”的,是受到出生漏報數(shù)據(jù)的扭曲,那么2015年根據(jù)1%小普查數(shù)據(jù)直接匯總的數(shù)據(jù)是否也是低估呢?
根據(jù)《中國統(tǒng)計年鑒2016年》中表2-17《育齡婦女分年齡、孩次的生育狀況》,將年齡別的生育率直接匯總,2015年總和生育率為1.05。同樣地,國家統(tǒng)計局對表2-17特別做了說明“2015年全國1%人口抽樣調(diào)查樣本數(shù)據(jù),抽樣比為1.55%”。這是樣本數(shù)據(jù)所對應(yīng)的總和生育率,國家統(tǒng)計局并沒有公開說明在總和生育率和年齡別生育率指標(biāo)上樣本能代表總體。不可否認,國家統(tǒng)計局2015年1%的樣本具有代表性,但是要做到所有的指標(biāo)都具有代表性是很困難的,尤其是出生和死亡方面的統(tǒng)計指標(biāo)。正是因為這一點,國家統(tǒng)計局在2017年公布《中國統(tǒng)計年鑒2017年》不再公布年齡別生育率。這也是避免出生統(tǒng)計上對世人的誤導(dǎo),由此引發(fā)學(xué)界和政府部門對一些錯誤認識的應(yīng)對和反饋所帶來的無謂消耗。
不過,國家統(tǒng)計局依然公布每年的出生人口數(shù)和粗出生率。相對于年齡別生育率,國家統(tǒng)計局公布的每年出生人口數(shù)和粗出生率可能誤差相對小些。根據(jù)國家統(tǒng)計局公布的2015年出生人口數(shù)為1655萬,粗出生率為12.07‰。根據(jù)國家統(tǒng)計局1%小普查的年齡別生育分布,我可以推算了1655萬出生人口所對應(yīng)的總和生育率為1.55。根據(jù)聯(lián)合國世界人口展望2017年修訂版的估計,2015年出生人口總數(shù)為1704萬人,對應(yīng)的粗出生率為12.2‰,總和生育率為1.62。因此,2015年總和生育率為1.05也是低估的。
美國統(tǒng)計學(xué)家達萊爾·哈夫出版了一本書《How to Lie with Statistics》,中文翻譯為《統(tǒng)計數(shù)字會撒謊》,是警告世人要對直接匯總和直接分析的統(tǒng)計數(shù)據(jù)要有清醒的認識。從2010年和2015年這兩個時點上的年齡別生育率這個統(tǒng)計指標(biāo)來看,直接匯總的統(tǒng)計數(shù)字真的會說謊。如果我們單純從普查數(shù)據(jù)或者1%小普查數(shù)據(jù)直接匯總年齡別生育率數(shù)據(jù),可能要陷入統(tǒng)計數(shù)字的謊言中。這種出生統(tǒng)計的年齡別生育率統(tǒng)計假象值得深入研究。為什么每年的出生人口總數(shù)和粗出生率與真實情況比較接近,而無論是普查還是抽樣調(diào)查,年齡別匯總的總和生育率卻常常偏離根據(jù)當(dāng)年出生人口總數(shù)核算的總和生育率?這種年齡別生育率直接匯總導(dǎo)致的“總和生育率低估”背后究竟是什么因素使然?對這些問題的思考將對分析歷次生育狀況調(diào)查結(jié)果具有重要意義。
從數(shù)據(jù)采集入手來分析可能更能發(fā)現(xiàn)調(diào)查數(shù)據(jù)中直接匯總年齡別生育率所存在的問題。我們知道,年齡別生育率的計算既要年齡別的出生人口(分子)準確,又要年齡別的育齡婦女(分母)準確。更重要的是,分母和分子能匹配上。就是說,分子都是分母所生且分母所有生育的孩子沒有遺漏,加上準確地將沒有生育的育齡婦女考慮在內(nèi)。如此看來,一個抽樣調(diào)查數(shù)據(jù)要準確估計年齡別生育率,至少需要滿足三個條件:
(1)分母中育齡婦女所生孩子都在分子中,
(2)非分母中的育齡婦女所生育的孩子不在分子中,
(3)適當(dāng)比例的未婚和未育的育齡婦女考慮在分母中。
這三個條件,(1)和(3)是最難保證的,也是總和生育率測不準的關(guān)鍵所在。這與我們調(diào)查樣本的代表性和育齡婦女在回答問卷時的認真程度以及問卷中未婚、未育育齡婦女的比例設(shè)計等緊密關(guān)聯(lián)。
當(dāng)然,如果我們從全員人口來看,直接匯總?cè)珖杏g婦女年齡別生育率是沒有問題的。而且這也需要確保全員人口數(shù)據(jù)庫出生人口數(shù)據(jù)的準確性和及時性。所以完善全員人口數(shù)據(jù)庫和出生人口數(shù)據(jù)庫對獲得準確真實的生育水平至關(guān)重要。當(dāng)然,即使我們獲得了真實的總和生育率,我們也應(yīng)該很清醒地認識到,其實,我們所統(tǒng)計的總和生育率從人口學(xué)角度來看,是一種時期總和生育率,是根據(jù)假想隊列來核算的總和生育率,其本質(zhì)上是一種假想生育率。因此,只有通過對歷史人口數(shù)據(jù)的校正,析出歷史年份的隊列總和生育率和時期總和生育率,完善中國生育數(shù)據(jù)庫,對認識歷史尤其是展望未來非常重要。
聯(lián)系客服