新型算力网络架构与部署方案研究

(整期优先)网络出版时间:2023-04-18
/ 2

新型算力网络架构与部署方案研究

耿燕

吉林吉大通信设计院股份有限公司  吉林省长春市  130012

摘要:网络架构算力水平是实施方案合理性和服务效能发挥的重要影响因素,在人工智能(AI)技术、区块链技术等不断成熟,应用水平不断提升背景下,基于新型技术构建新型网络架构,实现算力资源的优化利用,是新时期运营商应当关注的重点问题。本文在简要概述新型算力网络架构认识基础上,提出基于端边云超融合支撑的定制算力网络架构,说明具体的部署流程及性能分析要求,以此为相关技术应用提供参考。

关键词:算力;网络架构;部署方案

人工智能技术、超级计算机技术、云技术、区块链技术等,在生产生活中的应用不断拓展,极大改变当前人类社会生产生活方式。以新型技术为支撑,构建更为完善的网络架构,能够实现组网服务和算力资源的弹性调度,能够充分发挥网络架构的应用价值,能够为用户群体提供适应性的计算服务,满足不同用户的多样化需求。

1、新型算力网络架构的认识

1.1 算力的定义

在计算机及网络服务体系中,算力属于泛在概念,在不同应用场景下,具体含义有所不同。通常情形下,是指在设备内部状态改变情形下,每秒可以处理的信息数据量[1]。在计算机及网络技术快速发展背景下,算力主要包括如下几个分类:逻辑运算能力、并行计算能力、神经网络计算能力。在实际应用中,应当以算力资源的合理利用,有效的算力支撑为基础,满足用户群体优质服务需求。

1.2 算力评估指标

在智能化、多元化信息需求背景下,高效、低时延、精准的算力服务,是满足用户使用需求,优化算力服务应用部署方案的基本要求,因此在网络架构建设和优化时,必须要从技术、应用和管理等层面出发,采用定量分析方式对算力需求和算力水平进行评估,为具体建设和管理提供参考[2]。通常情形下,具体指标应当包括数据精度、延迟、宽带等方面,综合考虑网络整体的任务算力、任务处理需求、计算空间大小、功耗、连接手段等,根据不同场景,主要应用服务,对算力评价指标细化,最终实现对网络架构适应性、弹性和价值激励等性能的全面评估。

2、端边云超融合下的定制算力网络架构

2.1 基础设施层

基于终端设备、网络边缘、云端及超级计算机等为支撑,以区块链赋能所构建的新型算力网络,基础设施建设方面与传统网络架构存在较大差异,基础设施应当包括如下组成部分:一是端设备,如终端传感器、视频采集、交通灯等,能够实时精准采集网络运行数据,并实现数据的有效传输。二是边缘设备,主要包括AI小站、移动边缘计算基站、智能家居网关等,负责特定业务需求的推理和训练。三是云&超中心,是最为核心的基础设施,主要是在满足多数应用场景需求,有效执行大规模数据分析及深度神经网络训练推理前提下,实现与云计算的有机融合,优化算力网络架构,实现算力性能提升和算力资源的高效利用。

2.2 算力资源池层

算力资源池主要由端节点、边缘计算节点及超算平台组成,在软件定义网络和网络编排引擎支撑下,满足云管平台统一调度运行需求。在算力资源池运行中,管理器负责从基础设施层感知物理计算和网络,还需要将各种分散资源进行池化和分组,以满足资源调度优化需求,确保计算高效、有序运行。同时由于算力贡献者来源较为复杂,为确保架构稳定运行,算力资源池还应当具备分散算力资源使用情况的追踪,确保网络池运行私密性和可靠性。

2.3 调度优化层

调度优化是新型算力网络架构的核心组成部分,由于用户群体应用类别、应用场景等方面差异,在实际运行中,需要依据计算需求、网络需求及支付水平等进行分类。通常情形下,计算类需求主要包括密集型、适中型和轻量型;网络类需求主要包括快速型、适中型和低速型;支付费用需求分为较高型、适中型和较低型。采用合理的算法对整体目标进行优化,能够实现需求与底层算力资源的精准匹配,以此更好的提升算力资源优化利用。

2.4 AI执行层

AI执行层是以不同的神经网络特征,应用于不同的数据处理方面,完善执行平台运行方式。例如在文本识别中,可以采用反向传播网络;在语音识别中,可以选用循环神经网络;在图像识别中,可以选用卷积神经网络。在合理优化神经网络算法基础上,结合不同形式的学习平台框架,构建完善的执行平台,实现任务的有效执行。

2.5 区块链层

在新型算力网络架构中纳入区块链层,主要目的是以防篡改和可追踪方式,构建算力用户和算力贡献者之间的信任,激励更多的算力提供者加入网络架构。在当前技术体系下,区块链技术应用具有如下特征:一是分布式账本技术,在多方共同参与制定统一规则基础上,实现共同决策与维护,提升交易的可操作性和信任度[3]。二是基于共识协议提升工作量的优化分配,确保各个参与方在参与顺序上达到一致。三是基于智能合约,合理确定并自动执行服务费用,在无需第三方公证人情形下满足特定条件下的算力服务。四是基于密码学原理为算力网络架构运行提供安全保障。在满足上述要求基础上,实现算力网络架构在应用业务和系统业务等方面服务。

3、新型算力网络架构部署流程与性能分析

3.1 新型算力网络架构部署流程

本课题研究中,以当前算力需求量较大的短视频业务中动作识别需求为例,说明新型算力网络的具体部署流程。第一步是接收用户的AI任务需求,利用AI执行层感知识别任务类别;第二步是选择具体的神经网络和学习平台,对需要执行的AI任务进行训练推理;第三步是根据调度优化具体分类,对用户需求进行综合分析,有效适应不同用户的不同任务需求。第四步是依据用户任务需求,在调度优化后实现资源的最优化分配,动态构建数据与服务之间的弹性网络连接,将不同计算子任务分配至对应的算力资源池。第五步是在优化子任务传输路径,降低网络传输时延、能耗,提升传输可靠性和资源使用率,并将对应信息反馈至算力调度中心。第六步是将所有子任务分配至基础设备层,由对应设备完成计算。在完成上述任务后,会在区块链见证下,获取用户支付的服务费用。

3.2 新型算力网络架构的性能分析

新型算力网络架构是随用户需求而不断发展的,在实际运行中,需要具备良好的性能支撑,实现用户、组网及算力提供者等各个方面的效益平衡。因此在网络架构部署运行中,需要明确如下方面性能要求:一是要具备良好适应性,能够满足用户群体的时延需求;二是要具备良好的灵活性,能够优化计算资源调度方式和算力分配机制,实现算力资源的高效利用;三是能够为算力提供者提供有效的价值激励,实现效用最大化。在未来发展中,算力网络架构将逐渐朝向云原生趋势、确定性趋势及自智化趋势方向发展,能够在实际运行中制定最优化网络资源编排,优化任务调度方式;能够以高质量和高可靠的数据传输和计算服务,为各类产业智能化改造和数字化转型提供支撑;能够有效提升算力网络的“自治”水平,提升用户体验,最大限度解除网络功能实现对人力的依赖。

4、结束语

新型算力网络架构已经成为数据处理和运营的重要方式,是确保算力资源得以优化应用的重要途径,在运营商和相关企业规范发展中,必须要强化对新型算力网络架构优化的重视程度,从用户群体实际情况出发,优化具体部署方案,有效提升算力资源利用水平,为数字化、智能化社会建设提供坚实保障。

参考文献

[1]钟橙.算力网络部署方案探析[J].数据通信,2022(06):16-20.

[2]贾庆民,郭凯,周晓茂,彭开来,谢人超,黄韬.新型算力网络架构设计与探讨[J].信息通信技术与政策,2022(11):18-23.

[3]狄筝,曹一凡,仇超,罗韬,王晓飞.新型算力网络架构及其应用案例分析[J].计算机应用,2022,42(06):1656-1661.