广东省财政数据信息中心510030
摘要:我国电子政务经过二十多年的发展,取得了众所周知的巨大成绩,但是电子政务的发展同样面临诸多的问题,如:信息孤岛现象普遍、建设成本过高、数据开放不足、协调困难、低水平重复建设情况严重、整体满意度降低等,这些问题成为当前电子政务发展首先要解决的关键问题。造成这类问题的原因十分复杂,如果仅仅在原有电子政务建设模式的基础上加强管理和监督,推动局部的改进,无疑是治标不治本。必须充分认识到电子政务发展过程中的复杂性,针对复杂性问题制定有关策略和具体措施,才能从根本上提升电子政务的整体水平。而大数据理念的迅速普及、技术的快速发展和应用的不断深入为电子政务的发展提供了新的思路。电子政务系统的复杂性测量是电子政务系统信息资源管理、IT服务评估、运维服务定价以及运维持续优化等的基础。本文从数据的静态性和动态性两方面将系统的数据复杂性划分为数据结构、数据量和数据操作三个维度,构建了电子政务系统的数据复杂性测量模型,利用信息熵和复杂网格空间理论明确了电子政务系统数据复杂性计算方法。
关键词:电子政务系统;数据复杂性;信息熵;复杂网格空间
引言
准确测量电子政务系统的复杂性,是进行系统信息资源管理、IT服务评估、内部信息化绩效评估、系统设计评估与优化、运维服务定价以及运维持续优化等的基础。电子政务系统的复杂性已经成为了学界和业界关注的热点话题之一。比如,朱锐勋通过对电子政务系统中的政府行政组织模式变革的分析,提出了电子政务系统的网络数据交换、应用集成和体系结构的复杂性。Lee认为不同级别的任务复杂性会导致人们使用不同的决策标准和不同的验收决策模式,电子政务的任务复杂性影响了在线服务质量。相丽玲和朱景伟基于复杂适应系统理论对电子政务系统的复杂性进行了研究,提出了电子政务系统的设计工作和建设的发展策略。上述研究对电子政务系统的复杂性进行了初步探讨,但仍缺乏对电子政务系统复杂性测量的研究,难以有效评估电子政务系统复杂性程度。
电子政务是信息系统在政府管理和服务中的具体应用,因此电子政务系统的复杂性测量可以充分借鉴信息系统领域的研究成果。目前对信息系统复杂性测量的研究主要从信息系统软件、体系结构和配置过程等视角展开,其中基于软件视角的测量模型最为传统,并遵循软件开发方法的演进过程,分别面向软件结构、软件对象以及面向软件交互语句建立测量模型;基于体系结构视角的研究主要是用于解决系统设计、优化和重构等方面的问题,分别利用Petri网、信息熵等测量方法;基于配置过程视角的研究主要针对信息系统的运维过程,对运维流程进行结构抽象建模并按照配置行为进行复杂性模型求解。以上研究大多是基于信息系统设计、实现或运维的某个阶段,模型缺乏全面性和整体性,且大多未考虑用户行为和时间维度,其测量模型缺乏动态性因素。
1电子政务系统的数据复杂性测量模型
从信息处理论的角度来看,电子政务系统本质上是政务数据处理系统,其主要功能就是对政务数据进行采集、加工、存储和传播。数据既是电子政务系统的输入和输出,也是电子政务系统的管理对象,电子政务系统运行过程中会不断累积各类数据,反映政府的状态、特征、行为等。因此,从这个角度讲,数据的复杂性将决定对其进行管理的电子政务系统的复杂度,合理准确的界定数据复杂性的内容和范围,是测量电子政务系统复杂度的一个崭新视角。数据复杂性是指信息系统在运行过程中,从数据的静态性和动态性两个层面所反映的数据本身以及用户对数据对象操作的复杂程度。它包含了数据结构、数据量和数据操作三个维度,数据的静态性包含了数据结构和数据量,而数据操作则表征用户行为的数据动态性。数据复杂性测量空间{数据结构,数据量,数据操作}是一个三元组的测量域,而对于每一个测量域又由不同的测量指标构成,同时每一个测量指标对数据复杂性的影响程度是不同的。电子政务系统的数据复杂性测量模型。电子政务系统的数据复杂性测量模型能够更加准确、全面的测量电子政务系统的复杂性。一方面,电子政务系统的数据复杂性测量模型不但包括了系统本身的静态数据,而且考虑了用户对各网页页面进行操作的动态数据,其中静态的数据复杂性主要体现在后台数据库的数据本身,包含了数据结构和数据量,测量其复杂性的基本单元是数据表,而动态的数据复杂性则体现在表征用户行为的数据操作上,测量其复杂性的基本单元则是网页页面。
另一方面,从系统生命周期看,电子政务系统的数据复杂性测量模型不仅涵盖了系统设计阶段的数据结构,而且考虑了系统运维阶段的数据量和用户的数据操作。原有信息系统复杂性的研究更多的是研究如何测量软件本身或者系统体系结构的复杂性,而这些复杂性决定于系统设计阶段,没有考虑系统运维阶段产生的复杂性。电子政务系统的数据复杂性测量模型将数据量和数据操作纳入测量范畴,使得对电子政务系统数据复杂性的测量更加全面,这也将有助于电子政务系统运维服务成本估算、运维服务定价和运维持续优化。
2基于信息熵与复杂网格空间理论的数据复杂性计算方法
数据结构的信息熵模型:数据结构是指系统存储、组织数据的方式,而它的基础是数据模型,数据模型是一个描述数据、数据联系、数据语义以及一致性约束的概念工具的集合,而其中实体联系模型(E-R模型)是由PeterPin-ShanChen于1976年提出的,被视为目前最适用的描述数据结构的方法,所以应用E-R模型来描述数据结构是最佳的选择。E-R模型中主要有实体、联系和属性三个维度的8个指标,其中实体中主要是实体集数对数据复杂性的影响。联系中主要包含了联系集数、二元联系、M:N联系、1:N联系和IsA联系等6个指标,其中联系集数和IsA联系这两个因素主要是数量大小的影响,而二元联系指的是二元联系在联系所占的比例,M:N联系和1:N联系是指两者在二元联系中的比例,这几个指标是指单个基本要素对整体要素不同的信息贡献对数据复杂性的影响。而属性有属性数和属性类型两个指标,属性数是各个实体集和联系集中属性数的总和,同时每一个属性可能会对应不同的数据类型,而数据类型的不同也使得数据可取值的域是不同的,按照存储空间的字节大小将SQL的常用的24个划分为八个属性类型:k1=0.01、k2=0.02、k3=0.04、k4=0.08、k5=0.09、k6=0.1、k7=0.16、k8=0.5。
3实证研究—A市中小企业公共服务平台系统数据复杂性计算与分析
3.1A市中小企业公共服务平台系统介绍A市中小企业公共服务平台系统是于2012年2月26日开始上线运行的电子政务类服务平台网站,专门为该市内中小企业搭建了一个信息交流的平台,通过对整个城市内中小企业的信息整合,让企业更好的在企业集群中找到自己的供应商和市场空间,政府通过透明化的政策和信息支持来帮助中小企业更好地发展。
3.2结果分析与讨论
对复杂度的计算结果分析可知,w1,w2,w3分别是A市中小企业服务平台中数据结构(结构)、数据量(信息量)和数据操作(行为)三个方面的复杂性分量,‖w‖E则为统一的复杂性总值,二者结合起来,可作为从系统的局部到系统的整体综合评价系统复杂性的评价标准,其值越大,表示系统越复杂。从案例中的复杂性信息量值计算结果w2>w3>w1可以看出,对数据复杂性起决定性作用的是数据量的大小,因为作为沉淀电子政务业务的数据反映,其复杂性影响显然最大,另外还能说明,随着系统中元组数的增多,数据复杂性也会越来越大。同时,数据结构和数据操作同样对数据复杂性产生了影响,本案例中的w3略大于w1,说明因较高和不规律的用户访问使得行为数据对数据复杂性的整体影响要大于结构数据。特别地,行为数据为用来表征用户行为的动态数据复杂性的指标,在本案例中其复杂性量值大于数据结构的复杂性量值,说明行为数据是测量电子政务系统数据复杂性量值中非常重要的考虑因素,结合电子政务系统用户的多样化特点,因此其用户的行为强度(访问量)、行为密度(访问频度、并发数)、行为的规律性(高密度访问比,即存在多少峰值访问)均比传统企业内信息系统要来的复杂,因此分析与平衡电子政务系统的复杂性可以先从行为强度、行为密度和行为规律性等几个指标入手。
4结束语
电子政务系统的信息资源管理和绩效评估等问题的解决必须首先对政务平台的本身进行合理评价和度量,而论文提出的数据复杂性是测量电子政务系统复杂度的一个全新视角。为了全面、动态地测量电子政务系统的数据复杂性,论文将数据复杂性分为数据结构、数据量和数据操作等三个维度,构建了电子政务系统的数据复杂性结构模型,并利用信息熵和复杂网格空间进行电子政务系统的数据复杂性的模型计算。此方法从电子政务平台的系统本身和前台用户对平台网页的访问这两个层面来全面准确地测量其数据复杂性,不但能够提供电子政务系统全过程复杂性的测量方法,也为合理解决电子政务系统平台的成本估算、信息化绩效评估、运维服务定价等问题,为减少复杂性、实行简化设计,保障平稳运行并持续改善提供了理论依据和量化参考,同时,本文为复杂性研究拓展了新的空间。
参考文献:
[1]王立华.中国农村电子政务准备度评价——基于中国27个省(自治区)2004-2009年相关统计数据[J].情报杂志,2012,(05):139-143.
[2]朱锐勋.试论电子政务系统的网络复杂性[J].电子政务,2006,(93):15-17.
[3]相丽玲,蔡华利.电子政务建设的复杂性特征及其发展策略——基于CAS理论的思考[J].生产力研究,2007,(21):88-91.