北方自动控制技术研究所 山西太原 030006
摘要:随着我国科技的快速发展,软件技术也开始深入各行各业。针对软件技术的实际可控性展开分析和研究,可以发现其应用效果并不显著。在实际应用中通常会出现大量数据,而诸多行业的发展都需要运用数据,因此数据作为高价值的资源会对多个领域经济发展有所促进。基于此,文章对数据挖掘技术在软件工程中的应用进行了研究,以供参考。
关键词:数据挖掘;软件工程;应用研究
1数据挖掘技术的内涵
数据挖掘技术是一种基于大数据建立的综合性现代信息数据处理技术,能够根据工作实际需要对数据进行转化、处理和分析。数据挖掘是数据收集的动态过程,通过借助人工智能、数据库、机器学习、知识工程、统计学、信息检索、数据可计算等多种技术实现从海量数据中筛选出符合条件的信息数据,然后通过数据分析挖掘出有应用价值和研究价值的数据。数据挖掘流程主要包括数据的预处理、挖掘、整合三个环节。其中,数据预处理主要是对原始数据采用合适的数学计算方法进行整体脉络梳理和识别、转化,同时剔除无效数据,并对预处理后获得的数据进行抽样检测;数据挖掘主要是对预处理后的数据和系统新生数据采用系统算法和对应的分析模型进行分类和预测处理;数据整合主要是对得到的结果数据进行评价,用户可以根据自身实际需要对数据进行选择性应用,彰显数据最终价值,提升用户体验效果。
2数据挖掘技术在软件工程中的应用
2.1挖掘执行记录
所谓的程序执行记录挖掘,亦可以称为程序规约挖掘,便是指通过对程序执行跟踪过程的分析,对程序代码的协议进行挖掘。软件工程开发过程中针对执行记录的挖掘主要是对程序执行路径开展分析后,挖掘出相应软件程序代码中所具有的关联性。数据挖掘在检测执行记录中的应用,本质上便是通过跟踪相应的执行路径,利用逆向建模的方式检测相关数据信息,以达成有效维护、验证以及了解程序的目的。执行记录挖掘的应用过程,首先需要针对被分析的系统进行初步插装工序,而后针对挖掘软件所对应的编程接口、基本系统、程序模块等进行状态变量处理,同时记录相关数据。最后简约、聚类、过滤目标跟踪过程中所获取的数据信息,进而构建起能够表现系统全部功能的模型。
2.2挖掘版本控制
信息挖掘技术在版本控制系统中的应用,主要目的便是充分保障项目参与者所共同编制档案、文件以及程序数据库之间的统一性,以方便于后期全局性的更新工作。通常情况下,现阶段的软件工程开发工作基本都会使用到版本控制系统,实施软件工程开发的信息管理与保护工作。同时挖掘技术在版本控制信息中的应用,主要是对已变更历史信息的挖掘,探寻历史版本中不同模块、子系统之间存在的联系性与相互依存的关系。而后针对程序应用的实际使用效果以及未来变化、引入方式等进行持续性的检测与挖掘,以获取其中的漏洞、bug等。挖掘技术在版本控制信息中的应用,能够有效提升系统后期维护的有效性,同时降低开发成本,在有效规避后期变更所引发漏洞的基础上,充分发挥其对后期软件的持续性维护、预警价值。
2.3在软件漏洞检测中的应用
软件工程故障检测中的应用。在软件开发中,由于存在着大量的故障和错误,因此必须采用数据挖掘技术来进行故障诊断,以防止系统的失效,给开发人员和使用者造成不必要的损失。利用数据挖掘技术,对源代码中的错误数据进行分析和处理,并对可能发生的故障数据进行预测和检验,从而达到发现问题、解决问题、预防问题发生的目的。数据挖掘技术之所以在软件工程中得到了广泛的应用,就是因为它拥有强大的创展分析和错误查找能力,可以让开发者在最短的时间内,发现问题所在,采用修正和补救处理,大大提高了工作效率,并为使用者提供了一种较为稳定的安全措施。
2.4开源软件数据挖掘
开源软件是给用户提供的免费试用软件,其中克隆代码检测应用非常普遍,主要包括文本对比、程序结构对比、标识符对比、语义应用和索引对比等四种检测方法,在软件工程中的应用需要根据实际需求选择相应的检测方法。克隆代码技术能够根据软件开发相关标准实现代码快速拷贝和复制,然后根据软件开发目标和要求对拷贝的代码进行修改、完善和进一步检测,避免错误代码传递,确保系统正常运行。克隆代码技术不但改善了复制与粘贴的效率,提高了克隆代码检测速度,同时可以规避代码漏洞对软件系统影响,为开源软件开发和系统后期维护管理提供更多便利条件。但是,克隆代码技术的应用会受到环境开放性与动态性、数据多样性、Web软件开发大众化等因素影响,给用户使用带来管理和安全方面的问题。随着数据挖掘技术的不断进步与完善,其中对软件应用情况、错误报告、开发者详细信息等都会进行有效跟踪和自动记录,有助于软件开发人员构建出典型的社会网络,详细了解和准确把握网络动态变化,从而提高开源软件开发质量,提升开源项目管理整体效果。
3在软件工程中数据挖掘技术的应用对策
3.1重视数据挖掘技术的开发与应用
随着软件工程的迅速发展,应用越来越广泛,企业必须充分认识到数据挖掘技术在企业中的应用价值,并从其工作原理、引证方式等方面进行深入的研究。针对软件项目的需要,选用适当的数据挖掘技术,以保证软件的研发、运行、维护和管理工作能够按系统的实施,使研发工作能够按照设计的要求进行。在软件开发的全过程中,企业需要从多个方面来考虑项目的实施。例如,编码库的选取和静态编码的设定,若未能对其进行有效的控制,将会导致开发费用超过预算,从而影响到开发的正常进行。为了避免代码丢失,还需要设置静态代码,以确保在出现代码丢失的情况下,可以保存所有的数据,它可以通过数据存储器的功能来检测测试代码,从而确保系统的整体和合理性。
3.2提升数据挖掘技术的性能
应用数据挖掘技术在企业中迅速发展,但若只采用传统的数据挖掘技术,则会对企业的未来发展产生一定的影响,所以,在软件开发的过程中,必须对数据挖掘技术进行改进,以确保软件的开发和数据的查询效率。同时,在软件工程中,还需要定期评估数据挖掘的使用效果,以确保其使用的有效性,为了使数据挖掘技术得到持续的发展,必须对各个阶段、各个环节的应用进行系统的研究。例如,在病毒的处理中,利用数据挖掘技术进行时间分析,避免出现问题,降低企业和使用者的损失。它可以提高数据挖掘的各个方面的能力,从而促进软件工程的高效、快速发展,数据挖掘技术的性能提高可以通过建立一种评估标准来对其进行有效的评估,从而使其在实际应用中取得更大的进展。
结束语:
综上所述,可以明确在软件工程项目中,采用合理、科学的运营数据挖掘技术能够更好促进相关软件工程的可持续发展。以软件应用的实际情况为基础来展开相应分析,能够明确数据挖掘技术未来有很大的发展空间。有关技术人员需要明确该技术的重要性,并不断深入研究,对该项技术予以完善,对该项技术的理论和应用价值予以充分挖掘。采用这种方式从本质上加强该项技术的专业性,并通过技术人员的应用将其作用充分发挥出来,使我国软件工程技术能够获得可持续发展。
参考文献:
[1]谷安楠.关于数据挖掘技术在软件工程中的应用分析[J].数码世界,2020(12):76-77.
[2]张尚进.基于大数据时代下软件工程技术的应用研究[J].数码世界,2020(12):77-78.
[3]孙鹏飞.数据挖掘技术在软件工程中的应用探究[J].现代工业经济和信息化,2022,12(03):136-138.
[4]孙黎明.探索软件工程数据挖掘技术[J].软件工程师,2015,18(05):16-17.