深圳市浩瀚卓越科技有限公司 518000
摘要:在程序运算期间传统方法容易出现错误,因此根据AR动态图像,给出了相应的动作识别方法。对图像开展预处理操作,利用摄影装置收集人体信息,在此基础上建模,同时标记节点,利用AR技术让模型做出不一样动作,并且开展跟踪识别,对和动作相关的信息进行记录,进而达到人体动作识别。设计实验开展验证且和传统方式开展比较,表明所提出的方式可以达到人体动作识别,针对AR动态图像算法,有效彰显了其优越性。
关键词:AR图像;动作识别;基本步骤;神经网络;特征提取
引言:对于人体动作识别来讲,通常会涉及到目标检测以及目标跟踪等。在研究过程中,应该有效地把人体动作转变为可以运算以及研究的数据,且设置程序使电脑处理这些信息,这需很多的动作数据当作分析素材。过去的识别技术使用CNN算法以及深度学习等建模,不过在构建模型以及程序算法期间,运算精准性较低,容易出现错误,主要因为没有把动作转变成二维数据。所以,为了提升信息转换的精度,在动作识别中结合AR技术,构建了运动核心点保存数据库,之后对动作图像开展预处理操作。最为核心的步骤是借助AR技术,把摄影信息导入电脑中,建立三维人体模型且开展跟踪识别,再结合模型信息达到动作识别。
一、人体动作识别步骤
伴随近些年的发展,在人体动作识别研究上,通常是根据视频下人体行为开展分析,基于相关研究的进一步发展,对计算机视觉领域有了更高的要求。特别是目标检测和设备,该环节对整个系统有着较大的影响,属于人体识别的核心技术,有利于促进目标识别的达成,增加目标识别效率,为其奠定夯实基础。根据整体层面分析,在图像处理下的动作识别研究可以有效解决传统识别中的问题,以实现深层次识别的需要,有着一定的针对性。1.目标检测。对于目标检测环节来看,它是人体动作识别的重要步骤,采用的检测方式主要对图像开展后期处理,同时基于目标检测之上完成。现阶段,该环节可以结合各个检测目标划分成两种形式,依次是动态及静态检测,对于静态目标检测方法,通常是在静态图像下实施的目标检测方法,比如基础的静态手势和文本,对于动态目标检测方法,通常是在视频图像下建立的动态目标,比如人脸识别及跟踪等。2.目标跟踪。在开展目标跟踪过程中,通常是对特定目标,在视频图像下的一系列变化开展全面监视,比如目标的变化及位置等,都是基于相同背景下连续时间范围中实施的跟踪检测方法。根据本质层面分析,目标跟踪应基于目标检测技术的执行中实现,跟踪的目的主要对目标变化开展科学分析,使其达到基础的跟踪要求。现阶段伴随目标跟踪的发展,通常是结合目标颜色特征等,对目标跟踪过程中的动态情况开展确认[1]。3.目标识别。针对目标识别来看,它是在目标检测过程中,对运动个体开展全面分析及分类的方法。现阶段,有关的算法有两种形式,一为物理属性识别,二为运动属性识别。根据本质层面分析,第一种识别方法通常是根据检测目标区域的颜色特征等情况进行识别,第二种方法则是基于目标识别之上,结合目标的运动速度等情况开展辨别。
二、基于图像处理的人体动作识别
1.图像预处理。对于视频图像来看,因为视频监控设施和一系列因素的作用,会对其图像质量造成一定影响,从而给视觉效果带来干扰,不利于有关的处理分析工作。一般来讲,在进行人体动作识别前,应对获取的原始视频图像开展预处理,这样不但可以对原有噪声信息开展全面清除,还可以强化图像目标的相关信息,进而增强图像处理效率。2.运动目标检测方法。对于运动目标检测法,它划分为两个步骤,一是图像预处理,二是运动目标分割,在运动目标下实施的检测方法还包含两种类型,一是借助检测空间属性,结合各个目标轮廓,对运动目标开展全面检测,二是根据目标运动中的速度及加速度变化,将其当成衡量指标,借助背景减除法等开展目标检测。根据整体层面分析,现阶段目标检测方法的实际运用,还应结合目标所在环境和实际检测需要,促进有关检测方法的运用,从而增强检测结果精确性。
三、人体动作识别方法
伴随现代视频技术及科技的进步,图像处理智能化常常被运用于各个行业中,比如生物医学和航天领域,有助于促进图像处理进一步发展。就图像处理来看,它是借助计算机网络进行处理的专业技术,通常采用计算机来完成个性化处理,主要是为达成修改图像的目的,全面增强图像质量,通过图像可以获取更为科学的数据信息。因此,针对图像处理来看,在开展人体动作识别时,通常是对有关活动姿态开展识别,对各类人群的兴趣开展全面认识。1.特征提取。人体是非刚性物体,其做出的行为是多种多样的,由于人体姿态比较多元化,为科学识别人体动作,应结合特定动作模型,对各种环境中人体动作态势进行全面识别。在此应重视的是,人体动作模型构建的基础应是通过特征向量提取,然而该提取过程并非为特殊人群,应有一定代表性的普通大众特征向量,以达到各类人群在各种动作变化下的特征姿态。现阶段,对人体特征向量开展识别的方法,通常是结合人的高宽和区域性面积,还有提取目标在各种动作下与人形成的区域边界距离,这样才能构建人体动作模型,为其奠定夯实基础
[2]。2.分层识别器。分层识别器通常是结合目标差异特征向量,还有初始分类开展识别,它包含三个步骤,一为初始分类,二为深入分类,三为识别,以此达到动作有效识别。3.识别率结果分析。根据表1可以看出,在动作下开展识别,目标动作包含三种形式,依次是站立、弯曲以及躺下,这些动作均不复杂。然而,在进行识别时,还是会被外部条件及自身所干扰,可能会对其余动作目标开展错误识别。根据整体层面来看,该识别算法仅是对一般人体体型使用,针对比较胖或是比较高的人体体型来看,往往是无法使用的,为应对人体复杂动作,还应持续开展创新。
表1 人体动作识别率
实际动作 识别结果 | 站立 | 弯曲 | 躺下 | 图像 | 识别率 |
站立 | 162 | 38 | 0 | 200 | 81% |
躺下 | 0 | 0 | 200 | 200 | 100% |
弯曲 | 17 | 183 | 0 | 200 | 92% |
四、基于AR动态图像,关于人体动作图像预处理的分析
使用AR技术开展三维人体模型研究以及动态跟踪识别,可以借助动作增强技术来对轮廓进行分割处理,形成动作三维影像,且对其节点开展像素捕捉,让人体所有动作均可以转变为数据且录入处理程序之中。1.借助摄影设备收集人体数据信息。人体信息采集主要是把人体动作的一系列影像发送给计算机,按照相应的算法,对人体各部位动作开展全面识别,然而该采集方式的效率并不高,还极易出现错误,虽然目标人物也做了一样的动作,然而从其站立角度来看,却出现了偏转,这样一来,程序判定也将出现偏差。为获取有效信息,将建模当作目标,对人体信息开展全面记载,根据数字图像方法,将骨骼信息当作图像骨架,利用边缘检测手段来对区域进行明确,健全模型轮廓。接着以此建立头部及躯干等部位,从而获取人体特征以及模型质量几率,与此同时,采取位移的手段对关节进行推断,借助专业知识来完成对骨架的拟合,获取和动作有关的关节点。并对其位置坐标开展标记,以更好地开展人体模型构建。2.三维人体模型构建。获取健全的模型数据信息之后,便能够构建三维人体模型。模型需把人体动作数据有效体现出来,同时采取动态人物图像手段建立矢量坐标,智能匹配识别坐标。构建流程见图1。对动作特征开展辨别,依次采集模型中相对普遍的动作特征数据,比如左手挥手、前伸以及后手前踢、高举等。采取分割的手段,根据动作特征数据来针对身体构成部分,对相应的特征分量进行明确,同时计量角、点分量。假设动作特征量是f(z),针对动作改变重构,获取相应的动作特征量计量公式:f(z)'=z-1exp(-U*Sgiv)(1),在式子中,用f(z)'来代表动态特征量,用Z来代表特征分量,用U来代表二值函数,用Sgiv来表示均值灰度参数。在建模中引入AR技术,能够把模型引进二维空间,对场景进行模拟,基于这一条件,计量动作间差别,获取衍射灰度直方图。实施灰度值分割技术,获取三维人体模型。
图1 模型构建流程
3.人体动作数据集合获取。针对人物特征信息,通过跟踪识别技术来准确定位特征点,基于约束条件,对人物图像开展切割处理,以此获取分向量,同时根据AR的人物改变获取分向量集合。各帧图像的改变均应该再次建立灰度像素系数,获取识别特征函数:I(i,j)=G(x,y,z)P(x,y)ivP(x,y)if(2),在式子中,用G(x,y,z)来代表分向量集合,用来代表边缘函数集,用P(x,y)iv与P(x,y)if分别来代表x处与y处的向量映射点。这样,可以获取模型不同动作分量信息,把它们进行有效连接,便能够获取动作数据集合。4.基于改进动作识别算法,以达到动作识别。基于建立动作数据集合,开展动作识别的算法改进。可采用以下公式来计量动作概率:P=(3),在式子中,用P来表示运动数据在模型中达到的几率,也就是针对拍摄动作,其属于数据集中某一项工作的几率,用N来代表样本容量,用t来代表数据样本数[3]。在此之后,对特征量进行提取。基于对识别算法的改进,可以在电脑中进一步达到人体动作识别。
五、基于AR图像的识别方法和传统方法的对比分析
实验主要为了验证基于AR技术下的动作识别能否有效地提升动作转变为二维数据的精准率,且和多种算法开展对比,判定本文提出的方法和传统方式的优势与劣势。1.本实验硬软件平台的搭建。建立硬软件平台,以下是实际实验环境:硬件平台包括处理器、显卡(参数是132bit,6GB)以及内存(64GB);图像收集平台包含摄影机和成像仪;软件平台包含操作系统、运算平台(参数是MATLAB7.0)以及AR系统(Unity3D)。根据以上数据可知,借助摄像机开展人体数据采集,接着把获取的人体信息传输至计算机中,借助Unity3D模拟软件开展三维模型建设,同时利用该软件,对特征分量数据开展计算,借助MATLAB软件对获取的数据开展全面分析。对该方法的精准度及计算效率开展验证,可利用动态成像仪,模拟走路、握拳及转圈等动作,让二十个人分别完成,依次做出各种幅度的动作二十次,对这四种方法的识别精度开展科学计算。
2.不同方法的识别精准率比较。对采取四种方式所获取的特征信息进行整理,以下是比较分析结果:对于AR动态图像法,走路的识别率是96.5%,抬右手的识别率是100%,踢左腿的识别率是100%,握左拳的识别率是98.5%,喝水的识别率是95%,下蹲的识别率是94.5%,起跳的识别率是98%,弯腰的识别率是100%,转圈的识别率是100%,摇头的识别率是96.5%;对于神经网络算法,走路的识别率是94%,抬右手的识别率是94.5%,踢左腿的识别率是96%,握左拳的识别率是92.5%,喝水的识别率是90%,下蹲的识别率是91%,起跳的识别率是95.5%,弯腰的识别率是94.5%,转圈的识别率是99.5%,摇头的识别率是93.5%;对于深度学习法,走路的识别率是92%,抬右手的识别率是95.5%,踢左腿的识别率是92.5%,握左拳的识别率是91.5%,喝水的识别率是92.5%,下蹲的识别率是91.5%,起跳的识别率是94%,弯腰的识别率是96.5%,转圈的识别率是92%,摇头的识别率是94%;对于CNN算法,走路的识别率是93.5%,抬右手的识别率是92.5%,踢左腿的识别率是95.5%,握左拳的识别率是93%,喝水的识别率是94%,下蹲的识别率是90%,起跳的识别率是94.5%,弯腰的识别率是94.5%,转圈的识别率是92%,摇头的识别率是92.5%。根据以上数据可以看出,借助该方法开展动作识别,其平均精准度大概是98%作用,剩余方法的精准度依次是94%、93%、93.1%,由此可知,该方式对动作识别存在较高精准性,要远超过深度学习等方法,以此对相同动态成像仪等软件下识别率高的方法开展推断,基于三维动作之上,把AR动态图像法变为二维数据,其精确度会相对更高,动作识别方法也将实现预期效果,有着显著的优越性[4]。
结论:伴随科技不断更新,AI将是今后科技发展的主流,本文根据AR动态图像,提出了人体动作识别技术且对其开展验证,表明这一方法可以有效地识别人体动作,为人机交互的深入发展起到了借鉴作用。
参考文献:
[1]谭建梅,黄隽.信息背景下AR动态图像轮廓特征匹配拼接仿真[J].计算机仿真,2022,(06):138-141+272.
[2]李玉鹏,刘婷婷,张良.基于深度学习的人体动作识别方法[J].计算机应用研究,2022,(01):304-307+316.
[3]高晶,陈晓臻.基于AR动态图像的人物动作捕捉技术研究[J].现代电子技术,2021,(08):144-146+150.
[4]刘飞,郝矿荣,丁永生,刘欢.基于深度图像的人体动作识别方法[J].计算机工程,2021,(08):168-172+178.