简介:摘要:随着信息化和机械化设备的普及以及计算机存储能力的提升,越来越多的高维特征数据得以保存。这些高维数据在为多领域应用提供海量信息的同时,也造成了维度灾难问题。另外,高维多标签数据是当前机器学习领域的研究热点之一,多标签数据是指一个样本同时与多个语义相关联,它广泛应用在文本、音频、基因等领域。本文利用特征选择技术对高维多标签数据进行降维并分类。以特征工程为基本平台结合多类特征选择方法,基于结构稀疏化学习的嵌入式特征选择算法和基于信息论的过滤式特征选择算法提出解决上述问题技术方案,过滤掉冗余和对分类起负作用的无关特征,增强机器学习效率与准确率,可以有效的处理掉此类问题。