基于二维动态码技术的全站数字资源一本账一码通的设计与实现

(整期优先)网络出版时间:2024-10-08
/ 2

基于二维动态码技术的全站数字资源一本账一码通的设计与实现

刘志乾

安徽省大数据中心,安徽省合肥市,230001

摘要:本文设计并实现了一个基于二维动态码技术的全站数字资源一本账一码通系统,旨在通过统一的二维码管理平台,实现数字资源的无缝接入、高效使用、精准跟踪、智能感知、自动对账以及异常扫码行为的智能识别。该系统利用二维动态码的高信息容量、高识别率及动态更新特性,结合孤立森林算法进行异常检测,有效提升了数字资源管理的效率与安全性。本文首先介绍了系统设计的背景与意义,随后详细阐述了平台架构、功能设计、关键技术实现,并总结了系统的应用效果与未来展望。

关键词:动态二维码;数字资源;一码通

0引言

在进行政府信息化平台的建设过程中,随着涉及数字资源种类、数量的不断增加,对于各类数字资源的管理、使用跟踪、盘点核对的需求也日益增加,在传统的资源管理方式下,存在数字资源没有统一的编码生成规范,不同管理部门的资源归类、信息不一致,资源使用、变更、停用情况无法及时同步,资源情况盘点费时费力,使用的静态二维码安全性低、核验使用无法有效监控等问题,为解决这些问题,本文提出并设计实现了一种基于二维动态码技术的全站数字资源一本账一码通管理系统,实现对全站数字资源基于动态二维码的接入、使用、跟踪、感知、对账的统一管理。

1平台设计

1.1总体架构设计

1725349031403

图1 平台总体架构

系统主要有数据层、分析模型、应用层组成,数据层汇聚各类数字资源信息,通过各类分析模型实现数字资源、资源编码的对账、二维码感知分析等,在应用层通过数字资源目录系统进行数字资源的编目规范、目录及资源管理,通过数字资源编码系统实现资源编码、二维动态码的生成及全生命周期管理,通过数字资源关联分析实现数字资源关系模型,分析各类资源间的关联关系。

各类数字资源调用资源编码服务生成数字资源编码及动态二维码,并将资源编码与数字资源信息进行绑定,数字资源状态变更时,调用数字资源管理服务更新数字资源状态,并记录相关变更记录,用户通过扫码终端扫描数字资源的动态二维码,解析后返回对应数字资源信息页面展示给用户,用户可在页面中查询数字资源的基本信息、状态、关联其他数字资源信息等,同时系统记录该数字资源的核验记录,对于异常的扫码行为,系统通过孤立森林模型自动进行分析并产生预警。用户使用码对账服务对生成的资源编码及数字资源进行盘点核对,对生成未使用的资源等进行分析及预警。系统同时提供一本账服务,查询所有数字资源信息及相关统计、分布信息。

1.2码接入

为全省数据资源提供码接入统一服务,提供接入对象管理、接入标准管理功能,对编码接入对象的注册、审批等流程进行管理,同时记录码接入对象的数量,时间,安全等信息;对接入规范进行定义,并依据定义进行规范管理,展示规范内容。

1.3码使用

系统记录全省数字资源的使用信息,通过这些透视全省数字资源建设,应用及运行状况,为全省数字化政策及发展提供依据。

1.4码跟踪

基于数字资源生命周期信息,建立码流转库,并记录码流转时间、状态、地点、单位、应用、状态等信息。建立全方位的码生命周期信息库,以码生命周期信息库为基础,分析建立码的流转视图,为用户提供码流转信息服务,提供码趋势参考依据。

1.5码感知

依托数字资源主数据信息,建立基于码信息服务共享的一码识别感知功能。识码即识物,一码一物。并结合使用场景提供扫码识物解析服务功能,对码进行不同信息的关联信息及信息展现功能,可展示码的属性信息,也可展示码的动态信息及码关联资源流转的各个阶段信息、使用信息、关联信息等。

1.6码对账

通过编码管理工具,提供数字资源预发码和实际生成的编码进行对账,当编码不一致时及时预警,提供预警内容帮助快速排查资源使用差异原因;在编码对应资源在资源接入、编码生成、编码流转、编码使用销毁等场景下,部门之间、系统之间的编码的对比账目明细,提供预警功能,提供预警内容供问题解决。

基于智能对账原则,按照质量评估模型、稽查模型、血缘分析模型,对账双方资源总数、各类型资源数等信息,按照省市、部门、时间等固定维度排序展示资源详细信息,支持进行资源自动对账,并将对账结果在统一平台进行智能展示;在资源发码等场景下可避免由于发码失败导致的重复发码情形,通过统计分析筛查出现异常的编码及对应资源数据并定期发送给信息管理人员,对保障数据的有效性与完整性起到重要作用。

1.7异常扫码识别

系统会记录所有终端的扫码行为及相关的行为数据集【1】,包括ip、账号、扫码时间、终端信息、扫描频次等信息,使用孤立森林模型进行异常检测,分析同一个二维码被多次重复扫描、同一个数字资源的二维码被频繁扫描,扫码的终端设备不在常用区域,同一个终端设备、账号频繁扫描不同的数字资源二维码等异常行为场景,具体的数据集会将时间和类别特征转换为数值特征,构建孤立树并找出每个数据点的深度,根据每个数据点的深度判断它是否为异常点。在这一步中,深度较小的点会被判断为异常点,最后从数据集中选出被判断为异常点的行,识别出有异常行为的扫码数据并产生预警。

1.8目录管理

系统搭建数字资源目录,汇集云、数据、应用、组件和视频等各类数字资源,提供盘点管理、资源对账、对账预警、目录质量管理、目录治理等功能,基于统一的资源编码实现存量、增量数字资源统一纳管展示,并进行统计分析,形成资源一本账。

1.9数字资源图谱

通过数字资源数据完成图谱建模,构建数字资源图谱的本体或模式,设计数字资源图谱的数据骨架。结合实际需求,定义数字资源图谱中数字资源的概念、类别、属性、关系,形成关系模型。支持将异源、异构的数字资源数据融合,对数字资源图谱进行补充、去重、对齐和更新。支持对数字资源图谱进行分类、重组,实现数字资源、部门、项目、应用等一度、二度等关联分析,支持全省以及16个地市的数字资源图谱的展示。

2关键技术实现

2.1动态二维码

二维码分为动态二维码、静态二维码,动态二维码生成之后,可以随时更改二维码背后的各种信息而无需对二维码进行重新打印或生成,只要进行改动并保存,二维码就可以自动更新,再次扫描就是新的内容。静态二维码生成之后则再也不能被改变。生成的每个动态二维码都可以在后台看到详细而实时的扫描数据:扫描时间,扫描地点,扫描设备,扫描量等等,静态二维码则没有任何扫描数据。

在二维码的生成过程中,除了包含必要的资源信息外,还加入了防伪信息【2】。本研究采用国密SM4加密算法对二维码内容进行加密处理。扫码时,系统首先对内容进行解密,然后根据解密后的资源标识来获取数字资源的具体信息。

2.2孤立森林模型

孤立森林(Isolation Forest)是一种用于异常检测的无监督学习算法。它的基本思想是,异常点会比正常点更容易被“孤立”。

孤立森林模型通过构建多个决策树(称为孤立树)来实现这个思想。在每个孤立树中,数据点被随机选择的特征和特征值分割,直到它们被“孤立”(即,不能再被分割)。孤立树的深度(即,从根节点到孤立点的路径长度)可以用作异常分数:深度较小的点更可能是异常点。由于它不需要标签数据进行训练,使得孤立森林模型非常适合于异常检测任务。

系统会记录所有终端的扫码行为及相关的行为数据集【3】,包括ip、账号、扫码时间、终端信息、扫描频次等信息,使用孤立森林模型进行异常检测,分析同一个二维码被多次重复扫描、同一个数字资源的二维码被频繁扫描,扫码的终端设备不在常用区域,同一个终端设备、账号频繁扫描不同的数字资源二维码等异常行为场景,具体的数据集会将时间和类别特征转换为数值特征,构建孤立树并找出每个数据点的深度,根据每个数据点的深度判断它是否为异常点。在这一步中,深度较小的点会被判断为异常点,最后从数据集中选出被判断为异常点的行,识别出有异常行为的扫码数据并产生预警。

3总结

本文设计并实现了一个基于二维动态码技术的全站数字资源一本账一码通系统。该系统通过统一的数字资源管理平台,实现了数字资源的无缝接入、高效使用、精准跟踪、智能感知、自动对账以及异常扫码行为的智能识别。系统采用分层架构设计,集成了二维动态码技术、二维码防伪技术、孤立森林算法等关键技术,有效提升了数字资源管理的效率与安全性。未来,可以进一步优化系统性能,拓展应用场景,为数字资源的全生命周期管理提供更加全面、高效的支持。

目前,该系统已在安徽省一体化数据基础平台上线试运行,基于已有的云资源、数据资源、组件资源、应用资源、项目资源和视频资源六大类资源体系,形成一套适用于全省通用各类数字资源编目字典,通过编目字典标准对全省数字资源进行数字资源编码、数字资源目录管理,提供全省统一的数字资源管理,达到了预期设计目标。

参考文献:

[1]高玉涛, 张若愚, 赵旭栋, 田晓伟, 黄成祁, & 姚雪茜等. (2024). 面向企业数据安全场景基于孤立森林算法的数据访问异常检测与告警收敛方法. 数据挖掘, 14(3), 6.

[2]梁超, 董青. 防伪新思路——基于二维码的新型防伪系统设计与实现[J]. 中国自动识别技术, 2014(02).

[3]李倩, 韩斌, 汪旭祥. 基于模糊孤立森林算法的多维数据异常检测方法[J]. 计算机与数字工程, 2020, 48(4): 862-866.

作者简介:刘志乾,1972年9月,男,安徽怀宁人,安徽省大数据中心,硕士研究生,主要研究方向为电子政务、大数据发展、政务信息化系统融合及应用发展。