从2004年年初开始,湖北省地方税务局进行了一次全省范围内税源普查工作。为此,湖北省地税局动用了湖北地税系统1936个税务机关的近两万人,采集了约77万户纳税人的基本信息、税款征收情况以及社保费等数据,每个企业相关的表格多达20多张。
这是湖北省地方税务系统第一次如此大规模、全面的普查。这次普查的完成一方面得益于税务系统周密的组织,同时也得益于今年年初开始建设的数据仓库系统的帮助。没有数据仓库提供的分析和统计功能的支持,普查效果将大打折扣。调查历时数月,但调查结果一经整理录入计算机,各种统计信息就迅速地、多维度地展现在省税务部门各级领导面前,充分展示出了数据仓库的应用价值。
让领导参与信息化
湖北省地方税务局的信息化从2000年开始深入,这一年税收征管系统eTax在湖北地税系统得到全面推广,该系统将税务机关的日常管理、申报征收、会统合算、稽查选案、征管文书等业务全面实现了电子化。到2003年底该系统已在全省各市州、县税务局广泛采用。eTax的推广给湖北省地方税务局信息化带来了初步的成果,但如何更深入地推进湖北地税的信息化建设,让湖北省地税的信息化再上台阶,又摆上了湖北地方税务局信息中心主任郝荫昌的议事日程。
税收征管系统开启了湖北地税的信息化之门,提升了湖北地方税务系统基础数据的管理水平,但是其作用主要体现在基层,功能局限在业务信息化方面,在管理信息化比较欠缺,特别是领导层从中获益不多。另外,尽管有eTax系统,但地税系统领导看到的数据的真实性仍然存在问题。eTax中的数据信息都是由下面逐级汇报上来的,在很多时候,中间层处于各方面的考虑,可能会有意无意虚瞒报数字,等数据都汇总到省局时候,由于经过多级过滤,其真实性已经大打折扣。同时,eTax系统也无法提供各种分析和统计功能,而这些分析和统计正是领导制定相关政策的依据。
要让领导者们参与到信息化中来,领导参与信息化的程度将决定本单位信息化的广度和深度,湖北地方税务局信息中心主任郝荫昌这样确定了下一步的工作方向。于是,具有比较完善的统计和分析功能,能为管理决策层提供一个对全省数据一个宏观的、全面的把握,以辅助领导层决策的数据仓库被列入2004年湖北地方税务局的工作计划。计划要求一方面通过采用数据仓库,将基层征管所的数据是直接汇总到省局,保证省税务局长和县税务局长看到的都是同样的数据,提高数据的实时性,让省税务局的领导能掌握一手的资料,另一方面是通过数据仓库建立各种主题的数据分析,以帮助领导可以更有针对性地制定各种政策。
从数据分析到辅助决策
湖北省地方税务局的数据仓库系统选择了Sybase的数据仓库解决方案,项目建设计划分为三个阶段进行。前期主要完成数据的统计和分析,湖北地方税务局信息中心将此定义为数据分析系统,最终目的是建设成为一个辅助决策系统。
项目前期于2003年12月由Sybase数据仓库服务部来负责具体实施,二期则交由Sybase的合作伙伴Bestinfo公司数据仓库事业部承建。通过两个阶段项目的建设,目前已建成了数据仓库中有关纳税户、税金、税源普查和社保普查四个业务主题。并在数据仓库系统的基础上,实现了面向主题的联机分析系统,包括纳税户等四个主题的即席查询、数据钻取、多维分析。湖北省地税数据仓库系统包括:
1.源数据: 来源于Sybase ASE 12.0数据库服务器。
2.数据集中: 通过Sybase 复制服务器,完成各地市业务数据库到省局灾备中心的数据复制和存储。
3.ETL处理: 由Informatic PowerCenter数据转换和调度服务器负责从数据集中服务器中提取数据,经过转换后加载到数据仓库之中。在数据仓库模型基础上,实现eTax系统数据到数据仓库系统数据的抽取、清洗、转换和加载(ETL),将数据从省局集中的eTax数据库加载到数据仓库系统中。
4.数据展现: 运行Micro Strategy Intelligence Server及Web服务器和J2EE服务器,负责从数据仓库中提取数据,并提供各自应用服务。
5.数据仓库引擎: 运行Sybase ASE数据库服务器,为数据仓库系统中各种产品提供元数据管理服务器。
数据的标准化是关键
回头看看数据仓库项目取得的初步成功,数据的标准化被郝荫昌主任认为是项目实施的关键,同时也被认为是对湖北地税系统信息化的一次全面提升,因为这个项目帮助地税系统全面梳理了一次税务系统的数据流,也推进了湖北地税对标准化的认识。
为了保证数据流的通畅,湖北地税在数据标准上做了大量工作。一方面规范了各种信息分类、编码的标准,同时对各种报表、账册以及稽查的项目等都制定出了规范。更为重要的是,借此规范了省地税系统各处室的数据流格式,打通了系统内数据流的顺畅。下一步,湖北地税还计划与工商、财政等部门建立起数据交换的标准,逐步完成数据的共享。
数据的分布式存储、集中利用是这个项目的另一个特点。湖北地税数据仓库项目总体投资400万人民币左右,这和同类项目相比是比较少的。而其费用的节省就与项目采用的数据库复制技术相关。按照国家税务总局的要求,税务数据要采用大集中模式。但是湖北地税考虑到当地的经济条件相对落后,不具备正在实行数据大集中的广东和北京那样的经济实力,如果一步到位采用完全的数据大集中不太现实。在和项目的实施方Bestinfo仔细评估了数据大集中的利弊后,选择了数据分布存储、集中处理的解决办法。即在各地市的地方税务局集中保存税票的录入、申报表的录入等相关信息,而同时在将其中的关键信息通过Sybase数据库复制服务器,复制到湖北省局信息中心,并在这里经过数据的抽取、清洗和转化,进入数据仓库,最后服务于各种主题。既基本上已经达到了总局所规定的要求,又降低了初期投入。