1.华迪计算机集团有限公司 北京 100000;2.航信云享科技有限公司 浙江 乌镇 314501
摘要:“数据治理”这个词在近两年流行起来的。数据治理是指将数据作为组织资产,围绕数据全生命周期而展开的相关管控活动、绩效和风险管理工作的集合,以保障数据及其应用过程中的运营合规、风险可控和价值实现。文章通过对企业数据治理的发展以及现状问题的简单分析,针对性的提出大数据和云计算背景下企业实施数据治理的策略,并针对制定目标原则、数据治理保障体系、数据治理技术平台等方面展开探讨,以求更好推动企业在数据治理上的进步。
关键词:数据治理 企业数据 架构设计
一、从数据处理到数据治理
从以前单纯的数据ETL(抽取、转换、加载)到现在的数据治理,体现了一个数据应用的发展过程,数据体量大了,数据处理也更系统化了,这是企业信息化到企业数字化发展的必然过程。
早在2010年左右,大型企业掀起了建设商业智能系统(简称BI系统)的热潮,企业是否有BI系统甚至都成为了国资委考核国有企业信息化程度的一个年度考核指标。BI系统满足了企业信息化建设到了一定阶段产生的新需求。企业建设的各业务系统产生了各种业务数据,企业希望能够利用这些数据进行营销获客或管理提升,从而有了将各个系统数据通过数据ETL到数据仓库中,再加以利用的BI系统。那时,BI系统被认为是信息化建设皇冠上的明珠。当时受存储容量限制、计算量限制,数据仓库大多存储的是明细数据计算后形成的统计数据,极少有存储源系统的明细数据,而且各个系统标准不一的数据,都在ETL阶段解决,导致后续数据运维等工作量极大。
随着互联网业务发展,大数据存储与云计算技术发展,使得大数据量的存储与计算成本降低,数据处理与利用也日益进步。数据仓湖一体化代替了单纯的数据仓库,不仅统计数据不再话下,还可以存储和快速检索明细数据,使得数据分析有了“洞察”能力;数据ETL也随之进化成了系统化的数据治理,不再一味的只强调数据的后期治理,而是通过数据治理等从源头就解决数据互联互通面对的不一致问题,大大减少了不同系统数据关联的代价;数据也因为其具有的价值,而升级成为了数据资产。
二、企业实施数据治理的针对性方法及策略
(一)合理的目标
企业数据治理的目标达成不是一蹴而就的,必须做好长期作战的准备,循序渐进,逐步推进。数据治理应本着“大处着眼,小处入手”的原则,选择当前业务部门的数据要求和数据质量痛点为着力点,倒推出其数据来源问题进行重点整治,在该类数据治理得到价值体现后,再总结治理经验逐步开展其他类型的数据治理。
(二)统御全局的数据治理总体架构设计
虽然说数据治理可以先从“小处着手”,但也必须从“大处着眼”,这样逐步推行的数据治理才可以像拼图一样形成一个整体。
数据治理的总体架构由数据治理保障体系和数据治理技术体系组成,两大体系将作用于各业务系统进行数据治理。
数据治理保障体系包含组织、人员、制度和流程等方面内容,通过建立组织体系,落实各数据管理组织和支持部门的职责,通过制度和流程落实各级数据管理部门和提报人的岗位和职责。规范数据的新建、变更、使用流程,提升数据质量。
数据治理技术体系以元数据管理为核心,通过数据资产盘点,建立数据标准化体系,实施有效的数据质量、数据安全管理,实现数据的采集、处理、存储、使用的全生命周期管理,提升数据质量和安全性,实现统一、标准的对外数据服务,为产品创新服务创新提供支撑;以主数据管理为主线,打通各业务系统的数据通道,形成主数据的唯一数据源和统一的数据视图,实现主数据的统一管理,统一分发,统一应用,解决各异构系统的数据不标准、不一致问题,保障业务连贯性以及数据的一致性、完整性和准确性,提升业务系统之间的协同能力。
(三)建设数据治理保障体系
企业做数据化转型,做数字化经营,数据治理是常态化工作,需要企业的组织架构也做出相应的调整。
数据治理保障体系包括组织建设和制度建设。建立数据治理机构,明确组织岗位分工和职责,定义数据归属权、使用权,明确谁对数据质量负责。为了保障组织架构的正常运转和数据治理的各项工作的有序实施,明确建立一套涵盖不同管理颗粒度、不同适用对象,覆盖数据治理过程的管理制度体系,从“法理”层面保障数据治理工作有据、可行、可控。
数据治理制度体系将分政策、制度、细则、手册四级建立:
(1)数据政策:决策层(数据治理委员会/领导小组)制定,说明数据治理的企业定位和战略目标,明确其基本规则。特意说明,由于数据治理要协调现有的各个系统,使其遵守统一的数据标准,应用主数据,那么必须有强有力的决策层来推动,否则还会和传统的数据ETL,各源系统源源不断产生大量不一致数据导致数据想要应用就需要后期付出巨大成本清理,那么就称不上数据治理了。
(2)数据制度:管理层(数据治理归口管理部门)制定,按数据治理的职能域分别编制,为各
数据职能域内的活动开展而制定的一系列管理办法和流程。数据制度保证各类数据的业务管理部门能够相互协作,又各司其职,重点是做好分工。
(3)数据细则:执行层(业务部门的数据治理负责人员)制定,按数据治理的智能与分别细化,各业务部门制定本专业规则,为确保各数据治理制度得到执行落实而派生的实施细节规定。其中最重要的是产生各类主数据,并将其作为数据标准,使得各种数据有标准可依,各系统的同类业务数据遵循同一个主数据标准,为各系统数据的直接互联互通提供了充分条件。
数据标准是企业各部门、各利益干系人在数字化环境中使用的一种共同的语言,就像我们大家交流的语言一样,是在数字化环境中使用的一种语言。与秦始皇推行“书同文、车同轨”类似,设置在同一个企业中使用同一种数字化语言,文字的标准化在国家治理中有多重要,数据标准在企业数字化环境中就有多重要。数据标准,就像我们盖房子打地基一样,业务系统、数据仓库、数据质量,数据安全、元数据管理等,那么数据标准都是其他领域的基础,它是核心的基础。
(4)数据手册:执行层(业务部门的数据治理负责人员)制定,聚焦具体操作过程和方法,指导一线执行人员标准化开展特定的工作事项,针对某项具体工作指定的操作过程指引,取保操作标准准确。
(四)建设数据治理技术平台
数据治理技术体系的设计涉及数据的采集、处理、存储、访问、应用和分析等数据的全生命周期,不仅要考虑静态数据,如元数据、数据模型、主数据、共享数据的标准化问题,还要考虑动态数据,如交易数据、数据流转、大数据、ETL等数据全生命周期的管控和治理。市场上已有不少一体化的数据治理平台。
数据治理工具集融合元数据管理、数据标准管理、数据质量管理、数据集成管理、数据资产服务管理、数据安全管理、数据生命周期管理等七大产品模块,打通数据治理各个环节,产品模块可独立或任意组合使用,快速满足政府、企业各类不同的数据治理场景。
参考文献:
[1]甘似禹,车品觉,杨天顺,吴俊伟.大数据治理体系[J].计算机应用与软件,2018,35(06):1-8+69.
[2]夏尚.企业数据治理及其实践研究[J].现代商贸工业,2020,41(16):81-82.
作者简介:王兴晶(1977.1- ),女,汉族,黑龙江省青冈县人,本科,信息化保障中心副主任,中级工程师,研究方向:数据分析、数据治理。
杜彦亮(1985.5- ),男,汉族,河北省赞皇县人,本科,研发中心副主任,中级工程师,研究方向:云原生、数据分析、数据治理。