陆军工程大学 210000
摘要:深度学习和人工智能已成为我国当下的热门讨论话题,卷积神经网络模型作为深度学习模型中具有代表性的模型之一受到了许多研究者的关注。本文在介绍卷积神经网络模型发展历程的基础上,探讨了卷积神经网络模型在目标检测、语义分割以及自然语言处理方面的应用,以期能为该领域的研究者选择模型时提供参考。
关键词:卷积神经网络模型;特征提取;计算机
引言:简单来讲,卷积神经网络是一种以模型为工具对事物进行特征提取的算法,通过特征捕捉实现对同一特征事物的分类、识别、预测等处理,而卷积算法提取的特征更集中在局部,极大地减少了运算量,使得图像处理的效率被大大提升,扩大了该模型的应用范围。因此,对卷积神经网络模型发展及应用的研究极具现实意义。
一、卷积神经网络模型发展
卷积神经网络是一种含有卷积计算的计算机算法,被广泛应用于计算机视觉、自然语言处理等领域。在此之前,想要进行边缘性或特征性的检测,都需要依靠人工设计特定算法来辅助进行,且只能采用传统的分类器进行分类。在这种情况下,图片分类等计算机任务执行效率低下,图片分类结果精确性不高,计算机功能发展受到了一定阻碍。在此背景下,卷积神经网络应运而生,这种算法可以自动提取特征并对同特征图片进行分类,分类效率远高于人工特征算法。
神经网络的概念兴起于1943年,概念原理就是通过模拟人的神经元作用过程,简化神经元作用环节,开创提取型计算机算法。到1958年,该领域的研究者在此模型基础上,开发了机器学习功能,发明了感知器算法,该算法能够借助梯度下降的方式自动学习,并实现了多维数据的二分类。感知器属于线性模型的一种,无法正确处理异或问题,为了解决这个问题,神经网络领域研究者们花费了近二十年时间。1986年,研究者们提出了误差反向传播算法,该算法的出现突破了神经网络非线性分类和机器学习方面的局限,发展成为神经网络第二阶段的标志。从1998年LeNet-5被发明出来到2006之前,属于神经网络发展阶段中浅层学习的阶段,而2006年到如今,属于神经网络发展阶段中深度学习的阶段,其中,深度学习阶段有快速期和爆发期之分[1]。随着神经网络深度学习理论研究的不断深入,研究者们在提出了卷积神经网络模型的概念,并实验证明了卷积神经网络模型在分类准确性上的优势。
2012 年,AlexNet的提出使得卷积神经网络研究领域获得了巨大突破,在此之后,研究者们开始加大力度开发卷积神经网络结构。研究者们将卷积神经元进行改造堆叠,发明出了堆叠结模型,以此来加深网络升级性能,但是,从深度出发实现的模型性能升级并不能完全满足模型的功能需求,因此,研究者们又开发出了多分支开展计算的网中网结构模型,进一步拓宽网络宽度和深度,但是,参数量超标、过拟合、训练难度加大等诸多问题也随之而来。与此同时,残差结构作为解决上述缺陷而被提出,该结构一经提出,神经网络模型研究领域的研究者们就开发出了各种各样的残差结构模型。与从空间角度出发升级模型性能的做法不同的是,注意力机制模型的功能优势在于利用机制辅助识别特征通道的重要等级。由上述可知,卷积神经网络模型种类繁多,甚至有一些结构和用途较为特殊的特殊网络模型,例如结构简单参数量低的挤压网络模型、自主学习的生成对抗网络模型、结构权值完全相同的孪生神经网络模型、依靠线性运算显示冗余特征图的幽灵网络模型等等。
二、卷积神经网络模型应用
(一)目标检测
目标检测是计算机视觉领域的重要组成部分之一,其主要功能就是定位和分类图像目标,并显示目标位置和大小。二十世纪末,卷积神经网络模型就已经在计算机图像目标检测工作中实现普及应用,到了深度学习发展阶段,为了进一步提高计算机图像目标检测工作的准确性,研究者们基于卷积神经网络模型发明了性能更优良的R-CNN模型,此后,在卷积神经网络模型的基础上开发目标检测模型成为研究主流。具体来说,卷积神经网络模型的基础上开发的目标检测模型,其检测流程为候选、提取特征、分类,这种目标检测模型主要分两类,一类是锚点式目标检测,另一类是无锚式(Anchor-free)的目标检测,其中,锚点式的目标检测又可依据运行方式的不同分为候选区域网络基础和回归方法基础两种检测模型[2]。总而言之,借助卷积神经网络模型开发的目标检测模型在众多领域都得到了广泛的应用,例如,应用在我们日常生活中的某些智能人脸识别、人脸检测等识别系统中,或者应用在交通标志识别系统和车辆识别系统中,该检测模型甚至在病毒检测、船舶检测、火灾识别等领域都起到了关键性的识别作用。
(二)语义分割
语义分割是一种从像素角度出发,通过分类像素点,区分图像的不同语义区域来实现图像理解的图像处理方式,也属于计算机视觉领域。深度学习概念被提出后,结合卷积神经网络模型开发出的语义分割方法,其图像分割效率和语义划分准确性都优于传统语义分割方式,因此,卷积神经网络模型被大范围地应用于语义分割领域,这种语义分割方式主要分为解码器辅助开发的语义分割和多特征融合式的语义分割两种。2014年全卷积神经网络的出现,使得语义分割的功能特征达到像素级别,编码器和解码器研发成功后,语义分割网络的性能获得了进一步发展,随后,研究者们又针对语义分割模型的捕捉信息还原细节功能和上下文联系功能进行了改进,注意力机制的成功应用也间接提高了基于卷积神经网络开发的语义分割模型的分割质量,如今,语义分割网络已经在许多涉及图像的专业领域实现了广泛应用,如医疗图像系统、生物图像系统、公共图像系统等。
(三)自然语言处理
由于卷积神经网络模型的特征提取远超于其他模型,计算机视觉领域的研究者将其与自然语言处理网络相结合,研发出了许多性能更优、效率更高的自然语言处理模型,研究者们在卷积神经网络模型的帮助下,在自然语言处理研究领域完成了许多研究成就。自2008年开始,研究者们就在卷积神经网络模型与自然语言处理网络的结合研究上不断深入,强化模型在自然语言处理过程中对句子关键信息提取和分类的准确性,并在此基础上研发出了句子分类模型、语句情感分类模型、机器翻译模型、文本生成模型等具有实用意义的计算机模型,这些语言类的分类模型广泛应用与搜索引擎和软件开发,为计算机的现代化发展提供了技术支持。
结论:综上所述,卷积神经网络模型是一种包含卷积计算的、通过模拟人的神经元作用过程的特征提取型计算机算法。多年来,研究者们从机器学习功能、线性分类、模型结构等几个角度出发对卷积神经网络模型的性能进行了不断完善,如今,卷积神经网络模型已经广泛应用于计算机视觉领域的目标检测、语义分割、自然语言处理环节中,为计算机领域的现代化发展提供了动力保证。
参考文献
[1]张珂,冯晓晗,郭玉荣,等.图像分类的深度卷积神经网络模型综述[J].中国图象图形学报,2021,26(10):2305-2325.
[2]余久方.卷积神经网络模型应用研究[J].信息技术与标准化,2021(Z1):34-36+47.