当前位置 > 首页 > 统计工作 > 统计动态

国家统计局总统计师鲜祖德与相关企业代表走进新华网谈大数据战略合作实录(图)

来源:SRC-613发布时间:2013-12-04 14:00

积极推进大数据在政府统计中的应用

——国家统计局总统计师鲜祖德与相关企业代表走进新华网谈大数据战略合作实录

 

  主持人:各位网友大家好,这里是新华网的演播大厅,欢迎您在这个时段走进新华网演播间。最近,国家统计局与11家企业签署大数据战略合作框架协议,引起了广大网友的关注。今天我们请来国家统计局和企业代表,共同探讨大数据与政府统计的关系。现在向大家介绍一下到场的嘉宾:国家统计局鲜祖德总统计师、上海钢联电子商务股份有限公司朱军红总裁、百度在线网络技术(北京)有限公司黄林莉高级研究员、昆明泛亚有色金属交易所张子诺副总裁。欢迎大家!

 

  鲜祖德、朱军红、黄林莉、张子诺:各位网友好!

 

  主持人:非常高兴大家做客新华网。鲜总,两周前,国家统计局与11家企业举行了大数据战略合作框架协议签约仪式。您能不能给我们介绍一下实施战略合作的内容、背景和意义?

 

 

 

  鲜祖德:主持人好,各位网友大家好。很高兴能在这里和几位企业家一起来讨论大数据在政府统计中的应用问题。最近这些年,大家对统计工作和统计数据很关注很关心,统计数据不仅仅反映了社会经济的发展和变化,也对企业的生产经营活动越来越重要,同时也越来越贴近我们的日常生活。

 

  这些年,国家统计局为了提高统计能力、统计数据质量和政府统计的公信力做了很多的工作,不断地推进统计制度方法的改革创新和完善。成功实施了“四大工程”,也就是建立了真实完整的基本单位名录库、统一规范的企业一套表调查制度、功能完善的数据处理平台和安全畅通的企业联网直报系统。此外,还改进了服务业的调查制度,建立了城乡住户调查一体化的调查制度,建立了主要指标的环比制度等等。目前,国家统计局根据党的十八大和十八届三中全会的精神,正在进行新的改革和创新。比如,如何构建完善的统计指标来反映全面建成小康社会的进程、如何反映转型升级、以及如何综合反映地区的发展和民生的改善等等。

 

  随着社会经济的发展和科学技术的飞跃,政府统计工作紧跟时代的步伐推进改革与创新。大数据时代的来临,是我们面临着的新的机遇,正如马建堂局长在签字仪式上所说的:“谁拥有了大数据,谁就占有了制高点。就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础”。

 

  信息技术的发展对于我们收集数据、分析数据、发布数据提供了便利,我们也享受到了信息技术的成果。现在我们面临着一个新的时代,大数据已经深入到方方面面。世界上很多国家特别是发达国家,都已经把大数据的开发应用提高到国家战略的高度来研究。

 

  我们也正在进行这方面的研究和探索,对政府统计而言,主要是考虑到大数据的两个基本特点:一个是数据量大,一个是数据类型多。在现在信息技术条件下,谁都在生成数据,谁都可以利用数据。政府统计部门收集的数据来源更广更多,有各个部门的行政记录,有电商企业的数据,有包括搜索记录、社交记录和媒体等互联网数据。

 

  传统的统计数据往往是通过数字来表达的,而在大数据时代,我们面临更多的是非结构化的数据,比如图像、文本、日志,还有比如百度的搜索数据。这些数据都从微观层面反映了社会经济、人们日常生活行为的方方面面。如果我们能够把现有的这些数据都收集起来进行深入的分析和挖掘,就会发现这些数据当中隐藏的更深刻的规律和现象,就能更好地服务于政府决策和社会各方面的需求,大数据的真正价值就体现在这里。

 

  在这种背景下,我们与11家企业共同探索研究大数据在政府统计当中的应用,不断增强政府统计的科学性,使得我们的工作能够走在时代的前面,更好地服务于中华民族的伟大复兴的中国梦的实现。

 

  主持人:谢谢鲜总给我们介绍了大数据时代对各行各业的影响。这次国家统计局选择了哪11家企业,为什么选择他们?

 

  鲜祖德:这些企业大致分成两类:第一类是这些企业自己就生产数据,比如百度、昆明泛亚,他们生产的数据,本身就构成了大数据的一部分。第二类,这些企业收集各个方面的数据,比如上海钢联,他们除了自己的交易数据还收集了很多数据来生成一些指标和指数。不管是哪一类的企业,都有这样一些特点:第一,他们都在各自的行业做得非常优秀,业绩非常突出。第二,我们和这些企业有一个共同的目标,就是共同来开发大数据,共同为政府的统计服务。第三,也是更重要的一点,我们跟这些企业都有一种更宽广的胸怀来拥抱这个新的时代,一起探索未来。这也是国家统计局跟他们合作的一个基础。这11家是第一批,以后会逐步扩大,还会有其他的企业一起开展合作。

 

  主持人:谢谢鲜总。刚才说了在座的三家企业首先是优秀的企业。我们先来了解一下本身生产数据的两家企业,先请昆明泛亚的张总,为什么生产这些数据,这些数据对您的企业应用有什么影响?

 

  张子诺:我们的企业是昆明泛亚有色金属交易所,进行稀有金属的销售采购管理,是稀有金属产业天然的数据流汇聚的平台。这些数据从交易所的开盘开始就记录下来,每一分钟产生的稀有金属的交易价格、交易量、库存量都在填补全球数据空白。不光国家统计局、国务院信息办利用我们的数据进行行业的判断和决策,汤森路透、英国金属网等都在采用我们的数据,这说明我们的数据有一定的价值。我们的下游企业全部都是高科技的、现代军事、航天、电子、现代的新材料新科技的产业,代表了全球经济发展的未来和新经济的方向。在一个信息时代如何分析下游经济的走向和趋势,我这个平台的数据为这些分析判断提供了一些依据资料。

 

  我最近非常关注大数据的研究方向。我看到美国总统奥巴马说现在的大数据不仅仅是一个简单的信息产业IT产业需要关注的,也是国家战略层面一个非常重大的项目。大数据的战略很可能是下一时代的石油。

 

  主持人:所以,您抓住这次契机和国家统计局进行合作。您做有色金属交易数据有多少年了?

 

  张子诺:我们做了有3年时间。今年4月份,在国家统计局统计研究所专家的指导下,我们开发出第一个全球稀有金属的指数——泛亚有色金属指数,填补了全球稀有金属交易数据的空白,已经在全球作为一个重要的参考数据被使用。

 

  主持人:我们听听百度的黄林莉高级研究员怎么说。百度可以说是无处不做,你们生产的数据主要应用在哪里?

 

  黄林莉:我跟大家介绍一下百度公司拥有的天然优势,这也是这次国家统计局选择和百度合作的重要考虑因素。第一,百度从2000年开始提供搜索服务,抓取的是整个互联网的网页,处理的也是整个互联网的信息。所以从这个意义上来说,大家都说百度是含着大数据的金勺子出生。百度访问的网页有几千亿个,每天处理的数据量是100PB,这也是大数据时代一个数量级的象征。

 

  第二,随着百度自身的用户规模的快速增长,每天网民在百度上进行的搜索请求超过了50亿次,可以分到每1秒钟。这些用户搜索的数据就形成特别海量庞大的数据集合,也是具有十分高的统计价值,可以应用在各个方面——政府的宏观决策、经济的判断、生活的方方面面都可以做一些预测。还有一方面不可忽略的,百度掌握了大数据最先进的一些技术,同时它也是国内聚集了最多大数据相关领域人才的公司。

 

  鲜祖德:我们已经和百度谈过一次,在经济景气判断和民意关注的热点问题方面进行进一步的合作。

 

  黄林莉:我们的合作分几个方面来开展。

 

  主持人:请问一下上海钢联的朱总,您是收集数据的,是从什么时候开始收集数据的?

 

  朱军红:我们主要做钢铁、有色金属、能源、水泥等等传统产业数据的搜集。那个时候互联网交易不是很活跃,我们通过样本搜集价格,之后形成价格指数,逐步按照这个价格指数进行交易。我们从这个交易端开始跟踪到生产端、产品的流向和社会的库存。因为,我们的买家和卖家都是我们的会员,我们给企业做很多的数据提供,让他们对自己的产品投向、企业竞争、为什么我这个产品比别人卖得高和低、哪些客户对这些数据有兴趣有所了解。我们也向国外提供价格指数,全球最大的交易集团CME集团按照这个价格指数进行期货交易,直接进行交割。我们不仅有自己的交易平台,还有一个很大的采集队伍,有1000多人。这些数据能够给企业作判断,甚至我们可以把很多指数提供给国家,为宏观决策服务,比如一些产能的跟踪等等。我们是动态的跟踪,比如这个企业今天停产了没有,统计是在后面,我们是时时刻刻地跟踪。

 

  主持人:鲜总,国家统计局在推进大数据在政府统计中的应用方面,已经做了哪些工作?

 

  鲜祖德:国家统计局从前年就开始对大数据问题进行研究。马建堂局长亲自挂帅,组织调查和研究,多次召开工作会议,规划、制定大数据的应用工作。大数据对统计而言是非常重要的,因为统计就是关于数据的科学。大数据的特征表明,大数据不仅仅是传统的数据量的变化,更重要的是数据价值的提升。这种价值的提升不仅仅会影响我们的工作方式,还会影响我们的思维和一些观念的转变。对政府统计工作来说,大数据也将丰富我们的数据来源。就像几位企业家说的,他们有很多的数据,并且他们的这些数据经过汇总提供给国家统计局,这将丰富我们的数据来源,同时,也将对我们传统的统计数据的收集方式、处理方式、分析方法和发布方式,以及各个统计生产环节带来新的影响,这将促进统计生产方式新的变革。国家统计局这几年确实做了很多积极的准备和应对,也取得了一些成绩。

 

  第一,在思想上认识到大数据对政府统计工作的重要性和复杂性。首先要对传统的数据来源进行整理和梳理,同时,对于现在统计数据以外的数据,包括非结构化的数据更要进行梳理。要弄清楚哪些数据对政府统计工作有用,哪些是未来可能有用,哪些是现在一时半会用不上的。还要建立一些统计的标准。这些工作比较复杂,我们开始做了,还要长期做下去。

 

  第二,在对一些新技术的应用上取得了很大的突破。比如,全国有80多万家重点企业采取了联网直报的方式,这些企业的数据直接报送给国家统计局数据中心,去掉了中间环节;即将开展的第三次全国经济普查,全部采用了电子手持终端进行企业登记和普查,数据通过联网直报方式及时传送到国家统计局数据中心;在CPI调查中,也开始使用手持电子终端进行调查;在农作物调查、人口统计、投资调查等方面,开始用遥感技术和空间定位信息技术进行调查。

 

  第三,在一些专业统计制度上进行改革和完善。大数据应用首先是完善CPI调查,就是在价格调查方面要取得应用和突破。刚才几位企业家也介绍了这方面的情况。现在的CPI调查采用的方法是,我们在全国按统一的方法随机选一些调查点,调查员上门调查的方式。我们正在研究通过网上的交易数据、通过电商企业的数据来补充和完善,这样可以大大减轻基层统计调查员的负担。在交通运输统计方面,我们跟有关部门协商,正在研究利用高速公路上的射频感应技术对交通流量进行统计。我们也在和民政、工商、税务、质检等部门合作,利用他们电子化的行政记录来完善统计基本单位名录库。我们在这些方面做了很多的工作,下一步我们会在更多的方面和更多的领域,和更多的企业共同推进政府统计利用大数据的工作。

 

  主持人:这一次大数据的合作可谓是受很多人的关注。很多网友想问,在统计局和各家企业合作的过程中,如何保证数据是安全的。

 

  张子诺:刚才鲜总讲了数据怎么样通过分析、整理,为我们决策提供很多的依据。在数据如何敞开胸怀为实体经济服务这个层面,就我们交易所来说,我觉得不存在数据安全问题,因为我们现在的数据是百分之百公开,提供给所有的人来使用。我觉得这是做企业需要有的一种胸怀。我认为如果数据对整个行业的判断和实体经济的价值链的提升,对实体经济的价值整合有意义的话,我们愿意把所有的数据拿出来给大家使用。我们的上游产业是贸易商,下游产业80%90%是国际的贸易商、终端的使用者。原来我们没有这个综合的交易平台,把信息流、物流、数据流、资金流汇聚在一起,上游产业和下游产业对话是没有话语权的。因为丧失了定价权,整个行业的升级和产业的升级是没有资金和基础的。政府也想做产业的聚集,但是没有交易所是没有办法做的。有了交易所之后,整体提供给行业使用,对于判断行业的形势,把中国的产业聚集起来和下游进行公平的对话是十分有用的,我们愿意敞开胸怀把这些数据公开,让大家使用。而且越公开使用,越公开透明化,造假的数据和不实的数据对社会的危害就越小,这是我们所能做的。

 

  朱军红:国家统计更多地是定位在宏观,我们更多地是定位在微观。比如我们现在提供的是所有很细的一些指标为客户所应用,抽象出来的指标只在宏观上的应用多一些,可能对市场做的判断多一些。但是我们真正利用的一些非常细的指标,细到每一个对接、每一个点,这针对的是两个完全不同的服务体。我们将按照国家统计局的要求,来提交我们获取的这些数据。这也表明我们的数据更加有影响力,能更好地对社会进行服务。

 

  黄林莉:百度的数据来源于两方面:一方面是互联网本身自由的信息,还有网民在搜索过程中产生的大量的数据。这个正好跟大数据的特征是相关的。大数据是将个人的一点一滴的小信息汇总到一起,去产生宏观层面价值的分析和判断。从这个层面来讲,实际上网民的信息数据是安全的。同时,从国家层面来说,百度掌握的这些信息一定是为中国各级政府在经济、社会管理等各方面的决策所用。

 

  张子诺:我觉得现在社会,每一个人都在生产数据,我们每一次网络发布、每一次搜索行为和每一次网络交易都产生了数据,这些数据大家来分享是符合互联网精神的。

 

  朱军红:互联网是开放的。

 

  主持人:对于国家统计局来说,数据从不同的企业搜集上来,包括自行的收集,整个数据汇总上来,数据安全如何保障呢?请鲜总给网友说说吧。

 

  鲜祖德:国家统计局收集的数据既有宏观的,也有微观的。可以这样讲,数据的安全和数据的保密是一个全球性的问题。对这个问题,国家统计局是非常重视、认真对待的。从大的方面来讲,我们有《统计法》,《统计法》对保密的条款作了非常严格的规定,要保证我们的调查对象、个体的资料不对外泄漏,任何机构和个人都不得违反这个规定。从小的方面来讲,国家统计局制定有一套严格的规定,确保企业的资料、家庭的资料、个人的资料不得向外界透露,也不得提供给外界使用。在大数据的应用过程中,在不断推进信息公开的过程中,这也是一个新的问题,不管怎么样,我们会严格按照《统计法》和《保密法》的规定,保证数据的安全。

 

  主持人:刚才各方都谈了各个企业生产数据的背景情况。现在更多的网友特别关注的是我们在签约这个框架协议之后,如何推进实质性的工作。

 

  张子诺:我介绍一下和国家统计局合作的项目中双方的合作情况。第一,在我们共同签署的多方协议中,明确了共同研究探讨建立大数据应用的统计标准,包括指标定义、口径、范围、分类、计算方法、代码,把标准统一了,这是一个基础的工作。这就是为什么说泛亚有色金属交易所必须站在国家统计局多年积累的基础上做指数才有全球意义。第二,共同研究确定利用的数据,包括数据采集、处理、分析、挖掘和发布,我们按照国家统计局的统一节奏配合进行。第三,各方一致同意在其他方面开展合作,根据每个企业提供数据的特性和国家统计局合作的纬度,作具体的探讨。

 

  朱军红:我们做大宗商品可能跟国家统计局有更深的合作。我们也在讨论怎么样把这些数据更好地服务于国家。我们有很多的指数,在国际市场的应用程度也是非常高的。我们已经开始向国家统计局提供数据,我们还给工信部和商务部提供数据,比如很多产能的调查和市场的分布,包括各种产业的地图。

 

  张子诺:现在我们的数据报国家发改委、商务部、国家物资储备局,也是因为这些数据和产业的相关度相当高的原因。

 

  黄林莉:我们目前是集中在三个方面进行合作,当然这个合作会继续深化的。第一,在百度搜索和百度百科多个平台上,推广国家统计局的统计数据和统计制度方法。实际上6亿多网民都在使用百度,这方面的信息需求是十分庞大的,可能超出大家的想象。因此,这项合作能够在宣传统计数据的同时,为社会各方提供更好的数据服务。第二,探讨如何通过这样的搜索数据来完善宏观经济的预警模型,对宏观经济的走势进行预测,改善经济分析和预测工作。在百度大平台上沉淀了大量用户搜索数据,客观反映了网民在现实的生产生活中的行为规律和趋势。把这些数据资源和传统的统计信息相结合,就能够对宏观经济走势进行更好的判断和分析。第三,对百度的搜索和贴吧、知道等多个平台的网民搜集数据进行汇总和分析,进一步挖掘社会各方对统计数据的现实需求,从而能够进一步完善统计制度。

 

  主持人:非常感谢三位企业代表介绍了合作的一些内容。鲜总,框架协议也签了,接下来国家统计局将如何开展推广工作?

 

  鲜祖德:我们有三点考虑。第一,因为这个框架协议签字是一个开始,接下来还有很多的工作,首先是落实到具体的工作上,主要是根据国家统计局的总体安排,根据我们年度改革的需要,一个专业、一个专业具体地分析,哪些专业需要和谁合作,合作什么,下一步会有细化的过程。

 

  第二,各个企业数据收集的标准不一样,我们会跟每个企业在数据的标准、分类和数据如何使用方面进行研究。当然这个问题也是一个大问题,比较复杂,需要长期研究。

 

  第三,如何保持这种合作长期进行下去。企业向国家统计局提供数据,同时国家统计局也要为企业做好服务工作,这是互惠互利的,要建立一种长期的合作机制和合作办法。

 

  主持人:谢谢鲜总。第一次有11家企业参与合作,接下来还有更多的企业将与国家统计局合作,真正让企业和行业,以及国家在大数据时代都能够获益。感谢各位网友的关注,谢谢大家!

相关附件
相关文章
  • 联系我们
  • 服务条款
  • 网站地图
  • 中国统计资料馆
  • 数据咨询电话:
  • 010-68576320
版权所有:中华人民共和国国家统计局  京ICP备05034670号
地址:北京市西城区月坛南街57号(100826)