部门审批或登记单位资料整理和比对工作是经济普查清查过程中必然要面对的工作。从理论上讲,部门资料比对和经济普查清查的工作顺序可以有两种:1、先比对后清查;2、先清查后比对。无论哪种方法,部门资料都是经济普查清查的基础资料。
但是,由于部门资料来源不同、文件类型不一、格式多样、数据繁多,要尽量做到数据不重复,做到数据不漏的整理出来,是一项工作量大、技术难度较高的工作。我们的做法是:
第一步,要求不同的部门(包括编办、民政局、建设局、工商局、国税局、地税局、统战(民宗)部、教育局、司法局、交通局、农业局、卫生局、文化局、城管执法局、外贸局等部门)向经普办以电子表格形式提供部门登记资料,如登记号、名称、地址、电话等。
第二步,对各部门提供的电子表格数据库进行文件类型、格式统一,如把word变Excel文件类型统一;再把文件格式统一,如登记号、名称、地址、电话等列统一。
第三步,分析部门资料,确定出一些不可能有重复的部门数据,比如:编办、民政、教育、统战(民宗)部这些部门登记的数据与工商部门数据是必然不会有重复或关联的,因此,可以将工商库与这些部门资料先进行合并。
第四步,由于企业单位既要向工商部门登记,也要进行税务登记,所以以工商为基础的数据库表和以税务为基础的数据库表必然是有大量重复的,因此,这也是部门资料整理中的难点。工商库和税务库的比对和整理无法在电子表格中完成,我们选择了SQLserver2000数据库进行比对操作。具体步骤如下:
一、在SQLserver2000企业管理器中建立一个经济普查部门资料比对数据库,将工商、税务电子表格导入其中。如果数据导入不顺利,也可以先将工商、税务电子表格先导入ACCESS数据库中,再从ACCESS数据库导入到SQLserver2000中。导入过程中要检查数据类型的一致性,即同一个字段导入后数据内容是否完整。如果数据类型不一致,会使一些字段内容无法正常显示。后续的工作必须在导入数据全部正常显示的前提下才可以进行。
二、由于工商、税务数据库表中都包含了个体户资料,因此,单位名称中,个体户户主名称有可能是同名同姓的,我们在比对时要对这些单位分别处理。因此,工商、税务数据库表比对合并过程又分为以下步骤:
1、区分工商、地税内部单位名称有重复和无重复的,分步处理
2、内部名称无重复单位:
*工商登记号相同记录,从地税库中取地税号;
*单位名称相同但工商登记号不同记录,从地税库中取地税号;
*地税库中地税号不同于以上二项合并库的,取地税库完整记录;
*工商库中单位名称不同于以上三项合并库的,取工商库完整记录;
*以上数据合并,生成合并单位第一部分。
3、内部名称有重复单位:
*工商登记号相同记录,从地税库中取地税号;
*“单位名称+地址”相同但工商登记号不同记录,从地税库中取地税号;
*以上二者合并,生成合并单位临时库;
*地税库中地税号不同于合并单位临时库的,取地税库完整记录;
*工商库中工商号不同于合并单位临时库的,取工商库完整记录;
*以上合并,生成合并单位第二部分。
4、合并单位第一部分与合并单位第二部分合并,生成全部单位合并库。
第五步、从统计局名录库中导出单位名录数据,导入到经济普查部门资料比对数据库中。与前面生成的全部单位合并库进行比对。从统计局名录库中可以取到村委会、居委会以及一部分机关部门这些其他库不会有的单位数据,其他库中已有的单位数据也可以在与统计局名录库比对中提取单位法人代码等其他部门没有的字段资料。
经过以上合并处理过程,各部门资料已基本按不重不漏的要求合并在一起。由于我们较多时候只能采用单位名称进行部门资料比对,部门之间没有可供联系的唯一识别码,所以,我们在比对的过程中,可能准确率不是100%,比如,在几万条记录中可能会有几十条出入。这些需要普查员清查数据上报以后再进行核实。
第六步,在部门资料比对合并的基础上,在数据库中按地址或名称进行乡镇等区域初步划分。初步划分后无法由机器命令确定的单位,需进行人工区分普查区域。因此,要将已划分乡镇和未划分乡镇的记录分开来生成二个不同的表。未初步划分普查区域的记录导出生成电子表格,分发给普查办的工作人员进行人工普查区域(乡镇)划分,人工划分乡镇后的记录重新导入经济普查部门资料比对数据库中,与已划分乡镇的数据记录重新合并,生成已按乡镇进行初步划分的全部单位数据库,再由市经普办通知各街道、镇的经普办,安排人员到市经普办对自己管辖的区域再进行核对一次,以确保数据划分区域的准确性。
第七步,把全部单位记录数据库,生成分普查区(街道、镇)部门资料的电子表格发放给各街道、镇经普办。
第八步,各街道、镇经普办可以此部门资料为基础,进一步细分普查区。
普查员以细分普查区的部门资料为基础,因这些资料中,各单位就有的部门登记号等资料都较为完整,普查员上门进行清查登记时,只要对已有的资料进行核对,没有的资料或单位进行补充,这样,清查工作效率会有较好的提高。
部门资料先比对,再进行经济普查清查,清查上报后再进行查漏补缺,如此反复,能较好地防止单位登记的遗漏,对普查工作中切实做到单位搞全会有较好的帮助。
当然,这些只是我们的粗浅做法,在具体做的时候,每一次都会有更加完善的地方。我们希望与大家商榷和共享,共同促进工作水平和工作质量的提高。
附:数据合并比对过程中用到的主要数据查询命令
1、SELECT单位名称from税务表groupby单位名称havingcount(序号)>1
说明:查找税务表中单位名称有相同的单位记录
2、select*from表1wherenot单位名称in(SELECTdistinct单位名称from表2)
说明:从表1中查找单位名称与表2不相同的记录
3、INSERTINTO表1(工商注册号,建设文化注册号,名称,法定代表人,住所,联系电话,宗旨业务,登记类型,登记时间,区划编码,邮政编码,行业代码,营业状态,备注)SELECT工商注册号,建设文化注册号,名称,法定代表人,住所,联系电话,宗旨业务,登记类型,登记时间,区划编码,邮政编码,行业代码,营业状态,备注FROM表2
说明:将表2中的记录按相同字段顺序合并入表1中
4、UPDATE表1SET普查区='经济开发区'WHERE(地址LIKE'%经济开发区%')
说明:将地址中含有“经济开发区”字样的单位的普查区名称设置为“经济开发区”。
5、SELECTb.税务登记号AS税务登记号,a.*INTO合并表FROM工商表aINNERJOIN税务表bONa.单位名称+a.地址=b.单位名称+b.地址ANDa.工商登记号<>b.工商登记号
说明:工商表和税务表中,单位名称和地址均相同,但工商表中的工商登记号和税务表的的工商登记号不同的记录,一般可能是税务表中的工商登记号不够准确,因此,我们只从税务表中取出这些单位的税务登记号,其他资料以工商表为准。
(作者:浙江省永康市经普办 胡香青 章伟营) |