总人口的数据来源和计算方法

2024/10/31 10:00

|

Aa

字体:
|

一、数据来源

总人口基础数据的取得,主要依靠人口普查和依照国家法令,对出生、死亡、婚姻、迁移等人口事件进行的经常登记,及按照科学抽样的方法对人口状况进行的专项调查。下面分别对人口普查、1%人口调查和人口变动情况抽样调查的基础数据来源进行介绍。

(一)全国人口普查

人口普查是指在国家统一规定的时间内,按照统一方法、统一项目、统一普查表和统一标准时点,对全国人口普遍地、逐户逐人地进行的一次性调查登记。通过这种普遍的调查登记,查清全国人口的数量、结构和分布情况;同时,还要查清这些人口的社会、经济、文化等特征。人口普查工作,包括对人口普查数据的搜集、整理、评估、分析和发布等全部过程。

新中国成立以来,已分别于1953年、1964年、1982年、1990年、2000年、2010年、2020年成功开展了七次全国人口普查。从上述普查年份可以看出,1982年及以前的人口普查进行的时间是不统一的,这是因为过去国家对普查进行的时间未作明确规定。1986年8月,根据国务院《对今后全国人口普查工作安排意见的批复》,国务院原则同意今后每10年进行一次全国人口普查(即在末位逢零年份进行普查)。1994年7月,国务院批转国家统计局《关于建立国家普查制度、改革统计调查体系的请示》,正式确立国家周期性普查制度。2010年5月,国务院颁布施行《全国人口普查条例》,规定人口普查每10年开展一次,在逢0年份进行。在逢0年份进行人口普查,是联合国所建议并提倡的,也是世界大多数国家进行人口普查所普遍采用的时间(一些国家不在逢0的年份进行,但也是接近0的年份进行)。从这方面来讲,中国人口普查符合国际通行做法。

在中国,人口普查是和平时期最广泛的社会动员,国家需要投入大量的人力、物力、财力,特别是需要组织动员几百万名普查人员参与普查工作。以2020年人口普查为例,除普查机构工作人员外,全国还选调、聘用了700多万名普查指导员和普查员参与普查工作。

人口普查主要分三个阶段,先后要历时三年半。一是准备阶段。这一阶段的主要工作包括:组建各级普查机构,制订普查方案、普查细则和工作计划,进行普查试点,落实普查经费和物资,开展普查宣传,选调培训普查指导员和普查员,进行区域划分和普查地图绘制,进行户口整顿等。二是普查登记阶段。中国人口普查的标准时点为普查年度的11月1日零时,凡是这个时点居住在中国境内的人,都是人口普查对象。从11月1日起至此后的30余天,遍布全国的普查指导员和普查员将深入每一个社区、村庄,访问每一户家庭,按照普查方案的要求详细登记每一名普查对象的情况。普查登记阶段虽然只有1个月左右的时间,但这是整个普查工作中最为关键的环节,也是工作量最大、动员力量最多、直接决定普查数据质量的重要阶段。这一阶段的主要工作包括:普查员入户登记、进行全面复查、开展事后质量抽查等。三是数据整理和发布阶段。这一阶段的主要工作包括:普查表编码,审核、汇总,发布主要数据公报,普查资料开发利用等。

(二)全国1%人口抽样调查

又称人口小普查。通常是在两次人口普查中间年份(一般为逢5的年份)进行。之所以在两次普查之间安排一次1%人口抽样调查,是因为每10年进行一次人口普查,相隔周期较长,虽然在非普查年份和非1%人口抽样调查年份开展人口变动情况抽样调查,但是这个调查的样本规模较小,抽样比例只有1‰左右,一些项目对省级的代表性不够。另外,人口变动情况抽样调查相对于普查和1%人口抽样调查,设置的调查内容较少,不足以满足国家制定人口政策和经济社会发展规划的需要。有了两次普查之间的1%人口抽样调查,就可以弥补这些不足,为国家及时掌握人口发展变化情况提供较多的人口统计信息。中国已分别在1987年、1995年、2005年和2015年进行过四次全国1%人口抽样调查。

(三)全国人口变动情况抽样调查

因其样本量占全国总人口的1‰左右,又称1‰人口抽样调查。国家统计局从1983年开始进行人口变动情况抽样调查,以此获得年度全国和各省(区、市)的总人口数据及其结构变动数据。

在人口普查中,通过对全国所有人口进行逐户逐人地调查登记,然后逐级汇总,直接得到全国以及省、市、县、乡各个层级的人口数据。在1%人口抽样调查和人口变动情况抽样调查中,总人口数据是以上一年总人口数据为基础,通过调查得到的出生率、死亡率、迁移率等,推算出全国人口和各省(区、市)人口。

下面重点介绍在人口变动情况抽样调查中总人口的计算方法。

二、人口变动情况抽样调查中总人口的推算

人口变动情况抽样调查由国家统计局组织实施。国家统计局制定全国统一的《人口变动情况抽样调查方案》,统一设计全国和各省(区、市)的调查样本量,统一抽取各省(区、市)的村级样本,统一组织地方各级统计局具体实施人口变动情况抽样调查。全国人口和各省(区、市)人口由国家统计局统一推算。

(一)调查样本的选取

1.抽样设计原则

人口变动情况抽样调查以全国为总体、各省(区、市)为子总体进行抽样设计。调查采取分层、多阶段、概率与规模成比例的抽样方法。最终样本单位为住户组。

2020年人口普查结束后,在人口普查建立的样本框中,对2021年至2024年全国人口变动情况抽样调查进行为期四年的周期样本设计,统一抽取四年的样本,每次调查组织实施前下发到各省(区、市)进行核实。在四年调查周期内,人口变动调查样本按照一定比例进行轮换。

2.调查样本量

人口变动情况抽样调查的全国样本量约为140万人,约占全国人口的1‰。每个省(区、市)为2万~6万人。全国约调查12500个村级样本,50万个住户。

3.抽样方法

样本抽取采用两阶段抽样的方法,第一阶段抽取村级样本,第二阶段抽取住户组。在人口普查分村汇总结果中整理村级样本抽样框,抽取村级样本,在村级样本住房单元列表中抽取住户组样本。

(1)村级单位分层。充分利用人口普查和上年度社区表的资料,对所有村级单位进行分层。分层指标包括村级单位及其所在的县级单位社会经济发展指标及地理地形标志,村级单位城乡属性或根据本地情况考虑非农业人口比重、出生率、死亡率和流动人口、集体户人口等分层指标。分层的原则应尽可能使层内各单位之间异质性小,各层间异质性大。

(2)超规模村级单位分块。分层完毕后,对超过指定规模的村级单位进行分块,形成村级样本抽样框。

(3)层内抽取村级样本。各层按规模大小成比例的概率抽样方法抽取村级样本,其中各层抽取样本数按该层住房单元总数占子总体住房单元总数的比例分配。

(4)核实建筑物和住房单元。对抽中村级样本内的所有建筑物和住房单元,进行居住情况的核实、增减。

(5)根据核实结果抽取村级样本内的住户组样本及备用样本。

(二)数据汇总与推算

全国数据由国家统计局负责汇总,各省(区、市)的数据由各省级统计局按照国家统一的部署进行汇总。

1.省级调查指标估计

推算总人口的核心是估计出生率、死亡率、自然增长率。这里以2022年为例,估计2022年出生率、死亡率、自然增长率。用2021年11月1日至2022年10月31日调查年度的出生率、死亡率替代日历年度2022年全年的出生率、死亡率。省级出生率的计算公式如下:

其中,

则可推出,

其中,CBR表示2022年的出生率,为加权[1]后样本的2022年11月1日常住人口,为加权后样本的2022年的年平均人口,b、d分别为调查前12个月的加权后样本的出生和死亡人口。

由此可推出出生率的计算公式为:

推出死亡率的计算公式为:

其中,CDR表示死亡率。

自然增长率的计算公式为:

其中,NGR表示自然增长率。

2.全国调查指标估计

全国调查数据按各省级单位所占全国人口的比重进行加权汇总。全国出生率、死亡率、自然增长率的计算公式为:

其中,为全国出生率调查指标,为全国死亡率调查指标,为全国自然增长率调查指标,为各省(区、市)调查出生人口,为各省(区、市)调查死亡人口,为各省(区、市)人口占全国人口的比重。

3.总人口指标推算以上一年总人口数据为基础,通过以上计算得到的出生率、死亡率、自然增长率,推算出全国总人口。公式如下:

其中,为2022年全国总人口,为2021年全国总人口。

注:


[1]主要是指按各省(区、市)分城乡、分年龄和性别人口进行加权。

一、数据来源

总人口基础数据的取得,主要依靠人口普查和依照国家法令,对出生、死亡、婚姻、迁移等人口事件进行的经常登记,及按照科学抽样的方法对人口状况进行的专项调查。下面分别对人口普查、1%人口调查和人口变动情况抽样调查的基础数据来源进行介绍。

(一)全国人口普查

人口普查是指在国家统一规定的时间内,按照统一方法、统一项目、统一普查表和统一标准时点,对全国人口普遍地、逐户逐人地进行的一次性调查登记。通过这种普遍的调查登记,查清全国人口的数量、结构和分布情况;同时,还要查清这些人口的社会、经济、文化等特征。人口普查工作,包括对人口普查数据的搜集、整理、评估、分析和发布等全部过程。

新中国成立以来,已分别于1953年、1964年、1982年、1990年、2000年、2010年、2020年成功开展了七次全国人口普查。从上述普查年份可以看出,1982年及以前的人口普查进行的时间是不统一的,这是因为过去国家对普查进行的时间未作明确规定。1986年8月,根据国务院《对今后全国人口普查工作安排意见的批复》,国务院原则同意今后每10年进行一次全国人口普查(即在末位逢零年份进行普查)。1994年7月,国务院批转国家统计局《关于建立国家普查制度、改革统计调查体系的请示》,正式确立国家周期性普查制度。2010年5月,国务院颁布施行《全国人口普查条例》,规定人口普查每10年开展一次,在逢0年份进行。在逢0年份进行人口普查,是联合国所建议并提倡的,也是世界大多数国家进行人口普查所普遍采用的时间(一些国家不在逢0的年份进行,但也是接近0的年份进行)。从这方面来讲,中国人口普查符合国际通行做法。

在中国,人口普查是和平时期最广泛的社会动员,国家需要投入大量的人力、物力、财力,特别是需要组织动员几百万名普查人员参与普查工作。以2020年人口普查为例,除普查机构工作人员外,全国还选调、聘用了700多万名普查指导员和普查员参与普查工作。

人口普查主要分三个阶段,先后要历时三年半。一是准备阶段。这一阶段的主要工作包括:组建各级普查机构,制订普查方案、普查细则和工作计划,进行普查试点,落实普查经费和物资,开展普查宣传,选调培训普查指导员和普查员,进行区域划分和普查地图绘制,进行户口整顿等。二是普查登记阶段。中国人口普查的标准时点为普查年度的11月1日零时,凡是这个时点居住在中国境内的人,都是人口普查对象。从11月1日起至此后的30余天,遍布全国的普查指导员和普查员将深入每一个社区、村庄,访问每一户家庭,按照普查方案的要求详细登记每一名普查对象的情况。普查登记阶段虽然只有1个月左右的时间,但这是整个普查工作中最为关键的环节,也是工作量最大、动员力量最多、直接决定普查数据质量的重要阶段。这一阶段的主要工作包括:普查员入户登记、进行全面复查、开展事后质量抽查等。三是数据整理和发布阶段。这一阶段的主要工作包括:普查表编码,审核、汇总,发布主要数据公报,普查资料开发利用等。

(二)全国1%人口抽样调查

又称人口小普查。通常是在两次人口普查中间年份(一般为逢5的年份)进行。之所以在两次普查之间安排一次1%人口抽样调查,是因为每10年进行一次人口普查,相隔周期较长,虽然在非普查年份和非1%人口抽样调查年份开展人口变动情况抽样调查,但是这个调查的样本规模较小,抽样比例只有1‰左右,一些项目对省级的代表性不够。另外,人口变动情况抽样调查相对于普查和1%人口抽样调查,设置的调查内容较少,不足以满足国家制定人口政策和经济社会发展规划的需要。有了两次普查之间的1%人口抽样调查,就可以弥补这些不足,为国家及时掌握人口发展变化情况提供较多的人口统计信息。中国已分别在1987年、1995年、2005年和2015年进行过四次全国1%人口抽样调查。

(三)全国人口变动情况抽样调查

因其样本量占全国总人口的1‰左右,又称1‰人口抽样调查。国家统计局从1983年开始进行人口变动情况抽样调查,以此获得年度全国和各省(区、市)的总人口数据及其结构变动数据。

在人口普查中,通过对全国所有人口进行逐户逐人地调查登记,然后逐级汇总,直接得到全国以及省、市、县、乡各个层级的人口数据。在1%人口抽样调查和人口变动情况抽样调查中,总人口数据是以上一年总人口数据为基础,通过调查得到的出生率、死亡率、迁移率等,推算出全国人口和各省(区、市)人口。

下面重点介绍在人口变动情况抽样调查中总人口的计算方法。

二、人口变动情况抽样调查中总人口的推算

人口变动情况抽样调查由国家统计局组织实施。国家统计局制定全国统一的《人口变动情况抽样调查方案》,统一设计全国和各省(区、市)的调查样本量,统一抽取各省(区、市)的村级样本,统一组织地方各级统计局具体实施人口变动情况抽样调查。全国人口和各省(区、市)人口由国家统计局统一推算。

(一)调查样本的选取

1.抽样设计原则

人口变动情况抽样调查以全国为总体、各省(区、市)为子总体进行抽样设计。调查采取分层、多阶段、概率与规模成比例的抽样方法。最终样本单位为住户组。

2020年人口普查结束后,在人口普查建立的样本框中,对2021年至2024年全国人口变动情况抽样调查进行为期四年的周期样本设计,统一抽取四年的样本,每次调查组织实施前下发到各省(区、市)进行核实。在四年调查周期内,人口变动调查样本按照一定比例进行轮换。

2.调查样本量

人口变动情况抽样调查的全国样本量约为140万人,约占全国人口的1‰。每个省(区、市)为2万~6万人。全国约调查12500个村级样本,50万个住户。

3.抽样方法

样本抽取采用两阶段抽样的方法,第一阶段抽取村级样本,第二阶段抽取住户组。在人口普查分村汇总结果中整理村级样本抽样框,抽取村级样本,在村级样本住房单元列表中抽取住户组样本。

(1)村级单位分层。充分利用人口普查和上年度社区表的资料,对所有村级单位进行分层。分层指标包括村级单位及其所在的县级单位社会经济发展指标及地理地形标志,村级单位城乡属性或根据本地情况考虑非农业人口比重、出生率、死亡率和流动人口、集体户人口等分层指标。分层的原则应尽可能使层内各单位之间异质性小,各层间异质性大。

(2)超规模村级单位分块。分层完毕后,对超过指定规模的村级单位进行分块,形成村级样本抽样框。

(3)层内抽取村级样本。各层按规模大小成比例的概率抽样方法抽取村级样本,其中各层抽取样本数按该层住房单元总数占子总体住房单元总数的比例分配。

(4)核实建筑物和住房单元。对抽中村级样本内的所有建筑物和住房单元,进行居住情况的核实、增减。

(5)根据核实结果抽取村级样本内的住户组样本及备用样本。

(二)数据汇总与推算

全国数据由国家统计局负责汇总,各省(区、市)的数据由各省级统计局按照国家统一的部署进行汇总。

1.省级调查指标估计

推算总人口的核心是估计出生率、死亡率、自然增长率。这里以2022年为例,估计2022年出生率、死亡率、自然增长率。用2021年11月1日至2022年10月31日调查年度的出生率、死亡率替代日历年度2022年全年的出生率、死亡率。省级出生率的计算公式如下:

其中,

则可推出,

其中,CBR表示2022年的出生率,为加权[1]后样本的2022年11月1日常住人口,为加权后样本的2022年的年平均人口,b、d分别为调查前12个月的加权后样本的出生和死亡人口。

由此可推出出生率的计算公式为:

推出死亡率的计算公式为:

其中,CDR表示死亡率。

自然增长率的计算公式为:

其中,NGR表示自然增长率。

2.全国调查指标估计

全国调查数据按各省级单位所占全国人口的比重进行加权汇总。全国出生率、死亡率、自然增长率的计算公式为:

其中,为全国出生率调查指标,为全国死亡率调查指标,为全国自然增长率调查指标,为各省(区、市)调查出生人口,为各省(区、市)调查死亡人口,为各省(区、市)人口占全国人口的比重。

3.总人口指标推算以上一年总人口数据为基础,通过以上计算得到的出生率、死亡率、自然增长率,推算出全国总人口。公式如下:

其中,为2022年全国总人口,为2021年全国总人口。

注:


[1]主要是指按各省(区、市)分城乡、分年龄和性别人口进行加权。