简介:精确的网络流量分类是实现互联网可控可管的关键,传统的单一分类算法需要构建基于特定假设的某种模型,算法对于待分类数据的分布要求高,不能满足复杂多变的网络流量的分类要求。基于此,采用多决策树组合的随机森林算法实现网络流量分类。通过实际网络流量数据实验表明,在各种情况下,随机森林算法都能显著改善网络流量特别是小比例样本的分类效果,算法降低了单一算法过于依赖特定假设模型的要求,对于待分类样本的分布要求低,随机森林算法具有良好的分类效果和鲁棒性。
简介:当前信息系统中各类业务计划拟制软件资源消耗大,功能重叠度高,软件复用性弱,信息交互难度大并且使用操作复杂。针对上述不足,提出了基于插件的通用计划作业框架,通过计划信息处理功能复用和信息交互等关键技术研究,统一了多类计划软件的操作流程。同时,该作业框架还提高了软件复用程度,简化了软件界面。
基于随机森林算法的网络流量分类方法
基于插件的通用计划作业框架