国家统计局微观数据是如何开发应用的

2024/12/17 10:00

|

Aa

字体:
|

微观数据和宏观数据是数据领域中两个重要的概念,分别代表了数据的不同层次和观察角度。微观数据为使用者洞察世界提供了更为精细、翔实的信息,是保障宏观数据真实有效的基础性战略资源。

一、微观数据的概念及范畴

(一)微观数据的概念

微观数据是在特定调查背景下,对最小调查单元进行数据收集和记录的结果,如人口普查微观数据、住户收支与生活状况调查微观数据等。微观数据聚焦于细微层面的个体特征、行为和变化,其隐私权受法律保护。

(二)微观数据的范畴

根据数据来源的机构主体不同,微观数据可以分为政府微观数据、企业微观数据和个人微观数据。政府微观数据包括通过普查、全面调查、抽样调查、重点调查、典型调查等调查方式和行政记录所获得的企业、住户等个体数据,也包括通过遥感、卫星和网络等非传统方式获得的个体数据。企业微观数据包括企业在运营过程中收集、记录和存储的有关个体交易、行为和活动等详细信息的数据。个人微观数据是由个人产生的或与个人有关的,被记录在各种电子设备、社交网络、提供服务的企业以及政府数据库中以物理或电子形式记录的数据。

二、微观数据的作用和特点

(一)微观数据的作用

作为统计调查的第一手资料,微观数据因其广泛性和权威性,在服务宏观决策、满足科研需求、促进统计现代化改革等方面意义重大。

微观数据有助于决策主体科学制定和评估政策。通过使用微观数据,决策主体可构建相关模型模拟不同政策的实施结果,分析不同政策选项的成本和收益,从而作出合理选择。建立定量与定性相结合的评估体系,提高评估的针对性和有效性,准确反映政策实施效果。

微观数据有助于专家学者开展深度研究。专家学者可以利用微观数据设计多变量实证模型,开展多维度研究。获取更小调查单元的细节信息,为微观视角研究提供数据支持。对其本身或其他用户已有的研究结果进行重现、验证、驳斥和改善,形成更为可靠的研究成果。

微观数据有助于统计部门提升数据质量。在使用微观数据的过程中,用户可以对政府统计的分类标准、指标口径、调查方法、数据采集方式等有更深入的了解,并结合自己的专业背景,识别出异常数据和可优化的统计手段,促进统计部门改进调查方法,提升数据质量。

(二)微观数据的特点

微观数据主要具有非竞争性、非消耗性、高维度性和规模性等特征。非竞争性是指微观数据不存在复制成本或复制成本极低,同一数据可以被不同研究人员同时使用,且彼此互不影响。非消耗性是指微观数据并不会随着使用减少或耗尽,相反会在使用过程中产生新的数据,并可通过与其他数据结合使用,挖掘更多有效信息。高维度性是指微观数据具有多重特征或属性,这些特征可以是任何数值、分类、文本或其他类型的数据。规模性是指微观数据只有达到一定的规模、形成数据集后才有使用价值,单一或少量的微观数据往往不能产生经济或社会效益。

三、国家统计局微观数据开发应用情况

国家统计局于2017年启动微观数据开发应用工作,并在制度设计、实验室建设、合作交流等方面开展了卓有成效的实践。现已初步建成与中国实际结合、与国际通行规则接轨的运行管理模式。

(一)开发模式、开放对象及开放数据集

开发模式。国家统计局和国内有关高等院校共建数据开发中心,办公地点设在高等院校内,与局内微观数据实验室共同作为用户使用微观数据的实地场所,并制定了配套规章制度保障微观数据开发应用工作安全有序开展。2018年以来,陆续成立国家统计局微观数据实验室、国家统计局—中国人民大学、国家统计局—北京大学等数据开发中心。

开放对象。现阶段,国家统计局微观数据开放对象为中央部委及其下属科研机构,“双一流”建设高校和教育部直属高校,国务院直属中国社会科学院、中国科学院、中国工程院等科研机构,中国统计学会副会长所在单位和其他经国家统计局批准的高等院校、科研机构及具有法人资格和公共事务管理职能的事业单位。

开放数据集。目前国家统计局共分5批次开放了16类数据集供用户使用,主要包括规模以上工业企业财务状况调查,小微企业跟踪调查,住户收支与生活状况调查,第五次、第六次、第七次全国人口普查,2015年1%人口抽样调查,第三次全国农业普查,第三次、第四次全国经济普查,2018年全国时间利用调查等微观数据集。

(二)数据脱敏及安全评估

为保障数据安全,根据《中华人民共和国统计法》等法律法规,按照微观数据开发应用工作相关制度要求,统计部门通过采取抽样、隐去数据集指标代码和名称、重新编码、数据替换加密等技术手段对数据进行脱敏处理,并对处理后的数据进行安全评估,确保调查对象的个体信息无法被精准识别或推断后加载入库。

(三)数据申请使用流程及开发应用情况

国家统计局微观数据开发应用包括机构备案、数据申请与使用、中间成果带离、最终成果审核和最终成果登记五个环节。用户通过登录国家统计局微观数据用户注册申请系统,按照要求进行相关操作(具体申请流程可点击http://microdata.stats.gov.cn进行查看)。国家统计局微观数据开放以来,受到专家学者广泛关注,数据申请使用量稳步增长。截至2023年8月底,共有108家高校和科研机构通过认证,审批通过640位研究人员的数据使用申请,累计4245人次进入实验室使用微观数据,审批通过452份中间成果、80份最终成果,部分学者的研究成果在国内外核心期刊发表。

(四)宣传交流情况

国际方面,2019年11月,在北京举办了以“开放的微观数据,开放的政府统计”为主题的首届微观数据开发应用国际研讨会。2021年3月,应邀参加二十国集团第二阶段数据缺口动议“促进数据共享”国际会议。同年9月,为联合国统计司制作微观数据开发应用工作介绍视频,并在第三届联合国世界数据论坛播放。国内方面,接待海关总署、国家卫健委等中央部委,地方统计局队,有关科研院所来访调研。先后在中国人民大学、北京大学举办国家统计局微观数据开发应用研讨会,交流微观数据开发应用情况。

(五)未来展望

为更好发挥政府统计数据资源要素作用,结合国家统计局微观数据开发应用工作现状,下一步要健全相关法律法规和监管机制,推动微观数据开发应用依法依规进行,稳中有进开放。深化理论方法研究,探索更加科学有效的数据脱敏手段。夯实技术基础,优化微观数据开发应用系统,为用户提供更优质的资源和服务。

微观数据和宏观数据是数据领域中两个重要的概念,分别代表了数据的不同层次和观察角度。微观数据为使用者洞察世界提供了更为精细、翔实的信息,是保障宏观数据真实有效的基础性战略资源。

一、微观数据的概念及范畴

(一)微观数据的概念

微观数据是在特定调查背景下,对最小调查单元进行数据收集和记录的结果,如人口普查微观数据、住户收支与生活状况调查微观数据等。微观数据聚焦于细微层面的个体特征、行为和变化,其隐私权受法律保护。

(二)微观数据的范畴

根据数据来源的机构主体不同,微观数据可以分为政府微观数据、企业微观数据和个人微观数据。政府微观数据包括通过普查、全面调查、抽样调查、重点调查、典型调查等调查方式和行政记录所获得的企业、住户等个体数据,也包括通过遥感、卫星和网络等非传统方式获得的个体数据。企业微观数据包括企业在运营过程中收集、记录和存储的有关个体交易、行为和活动等详细信息的数据。个人微观数据是由个人产生的或与个人有关的,被记录在各种电子设备、社交网络、提供服务的企业以及政府数据库中以物理或电子形式记录的数据。

二、微观数据的作用和特点

(一)微观数据的作用

作为统计调查的第一手资料,微观数据因其广泛性和权威性,在服务宏观决策、满足科研需求、促进统计现代化改革等方面意义重大。

微观数据有助于决策主体科学制定和评估政策。通过使用微观数据,决策主体可构建相关模型模拟不同政策的实施结果,分析不同政策选项的成本和收益,从而作出合理选择。建立定量与定性相结合的评估体系,提高评估的针对性和有效性,准确反映政策实施效果。

微观数据有助于专家学者开展深度研究。专家学者可以利用微观数据设计多变量实证模型,开展多维度研究。获取更小调查单元的细节信息,为微观视角研究提供数据支持。对其本身或其他用户已有的研究结果进行重现、验证、驳斥和改善,形成更为可靠的研究成果。

微观数据有助于统计部门提升数据质量。在使用微观数据的过程中,用户可以对政府统计的分类标准、指标口径、调查方法、数据采集方式等有更深入的了解,并结合自己的专业背景,识别出异常数据和可优化的统计手段,促进统计部门改进调查方法,提升数据质量。

(二)微观数据的特点

微观数据主要具有非竞争性、非消耗性、高维度性和规模性等特征。非竞争性是指微观数据不存在复制成本或复制成本极低,同一数据可以被不同研究人员同时使用,且彼此互不影响。非消耗性是指微观数据并不会随着使用减少或耗尽,相反会在使用过程中产生新的数据,并可通过与其他数据结合使用,挖掘更多有效信息。高维度性是指微观数据具有多重特征或属性,这些特征可以是任何数值、分类、文本或其他类型的数据。规模性是指微观数据只有达到一定的规模、形成数据集后才有使用价值,单一或少量的微观数据往往不能产生经济或社会效益。

三、国家统计局微观数据开发应用情况

国家统计局于2017年启动微观数据开发应用工作,并在制度设计、实验室建设、合作交流等方面开展了卓有成效的实践。现已初步建成与中国实际结合、与国际通行规则接轨的运行管理模式。

(一)开发模式、开放对象及开放数据集

开发模式。国家统计局和国内有关高等院校共建数据开发中心,办公地点设在高等院校内,与局内微观数据实验室共同作为用户使用微观数据的实地场所,并制定了配套规章制度保障微观数据开发应用工作安全有序开展。2018年以来,陆续成立国家统计局微观数据实验室、国家统计局—中国人民大学、国家统计局—北京大学等数据开发中心。

开放对象。现阶段,国家统计局微观数据开放对象为中央部委及其下属科研机构,“双一流”建设高校和教育部直属高校,国务院直属中国社会科学院、中国科学院、中国工程院等科研机构,中国统计学会副会长所在单位和其他经国家统计局批准的高等院校、科研机构及具有法人资格和公共事务管理职能的事业单位。

开放数据集。目前国家统计局共分5批次开放了16类数据集供用户使用,主要包括规模以上工业企业财务状况调查,小微企业跟踪调查,住户收支与生活状况调查,第五次、第六次、第七次全国人口普查,2015年1%人口抽样调查,第三次全国农业普查,第三次、第四次全国经济普查,2018年全国时间利用调查等微观数据集。

(二)数据脱敏及安全评估

为保障数据安全,根据《中华人民共和国统计法》等法律法规,按照微观数据开发应用工作相关制度要求,统计部门通过采取抽样、隐去数据集指标代码和名称、重新编码、数据替换加密等技术手段对数据进行脱敏处理,并对处理后的数据进行安全评估,确保调查对象的个体信息无法被精准识别或推断后加载入库。

(三)数据申请使用流程及开发应用情况

国家统计局微观数据开发应用包括机构备案、数据申请与使用、中间成果带离、最终成果审核和最终成果登记五个环节。用户通过登录国家统计局微观数据用户注册申请系统,按照要求进行相关操作(具体申请流程可点击http://microdata.stats.gov.cn进行查看)。国家统计局微观数据开放以来,受到专家学者广泛关注,数据申请使用量稳步增长。截至2023年8月底,共有108家高校和科研机构通过认证,审批通过640位研究人员的数据使用申请,累计4245人次进入实验室使用微观数据,审批通过452份中间成果、80份最终成果,部分学者的研究成果在国内外核心期刊发表。

(四)宣传交流情况

国际方面,2019年11月,在北京举办了以“开放的微观数据,开放的政府统计”为主题的首届微观数据开发应用国际研讨会。2021年3月,应邀参加二十国集团第二阶段数据缺口动议“促进数据共享”国际会议。同年9月,为联合国统计司制作微观数据开发应用工作介绍视频,并在第三届联合国世界数据论坛播放。国内方面,接待海关总署、国家卫健委等中央部委,地方统计局队,有关科研院所来访调研。先后在中国人民大学、北京大学举办国家统计局微观数据开发应用研讨会,交流微观数据开发应用情况。

(五)未来展望

为更好发挥政府统计数据资源要素作用,结合国家统计局微观数据开发应用工作现状,下一步要健全相关法律法规和监管机制,推动微观数据开发应用依法依规进行,稳中有进开放。深化理论方法研究,探索更加科学有效的数据脱敏手段。夯实技术基础,优化微观数据开发应用系统,为用户提供更优质的资源和服务。