简介:以氨基酸组成为特征对膜蛋白的分类,忽略了序列残基之间的相关性信息,而采用传统支持向量机算法作为分类算法,在解决多类问题时会出现分类盲区问题。针对这两种情况,计算蛋白质序列的氨基酸组成、二肽组成以及6种氨基酸相关系数,将三类特征结合,作为膜蛋白序列的特征向量;同时采用模糊支持向量机作为分类器,解决了传统支持向量机在多类数据识别中的盲区问题。测试结果表明,在相同特征输入下,模糊支持向量机分类性能优于传统支持向量机;在相同分类器的情况下,氨基酸组成、二肽组成和相关系数组合的特征选择方法的分类性能优于只使用其中一类或两类特征的方法;而采取组合特征和模糊支持向量机相结合的分类策略,在独立性数据集测试中的整体预测精度达到97%,优于现有的多种分类策略,是目前最有效的膜蛋白分类方法之一。
简介:通过比较脑肿瘤患者和正常人脑脊液的二维凝胶电泳图谱(two-dimensionalelectrophoresis,2DE),并对差异蛋白进行质谱鉴定,以寻找肿瘤特异脑脊液蛋白.以脑肿瘤患者和正常人的脑脊液为研究对象,采用固相pH梯度(immobilizedpHgradient,IPG)2DE分离总蛋白质,凝胶经银染显后,用ImageMaster2D图像分析软件进行比较分析、识别差异表达的蛋白质.结果得到肿瘤患者脑脊液蛋白点924个,正常脑组织蛋白点607个,匹配512个,匹配率分别为55.4%和84.3%,去冗余后发现,有35个蛋白点只在脑肿瘤患者脑脊液图谱中出现.肿瘤患者脑脊液和正常对照脑脊液双向电泳图谱有明显差别,但是本实验尚未对这些差异蛋白进行质谱鉴定,所以未找出肿瘤特异蛋白.
简介:胸痛三联征在临床上有相似的胸痛症状,误诊率居高,其确切病因尚不十分明确。针对经典支持向量机不适用于胸痛三联征此类非平衡数据集分类的缺点,本研究结合径向基核函数、布谷鸟算法以及支持向量机,提出一种基于布谷鸟算法优化支持向量机的分类识别模型,用于胸痛三联征的分类诊断。在收集到的735例有效样本数据集上,采用Java程序抽取平衡数据集。实验结果显示,基于平衡数据集,该模型的平均正确率为80.667%;基于非平衡数据集,其平均正确率为97.767%,相比经典支持向量机、粒子群算法-支持向量机、遗传算法-支持向量机均有不同程度的提高。因此,本研究模型对胸痛三联征的分类诊断具有一定的参考价值。