论文检索
期刊
全部知识仓储预印本开放期刊机构
高级检索

基于跨模态近邻流形散布的基因特征提取方法OA

中文摘要

为解决因基因表达数据维度高、样本少、噪声高等特点导致在基因分类研究中难以提取有效特征的问题,提出了跨模态近邻流形散布(cross-modal nearest neighbor manifold scatter,CNNMS)方法,在核方法基础上采用近邻数据的方式,从而进一步降低了类别不平衡对分类精度的影响。此外,基于近邻均值受异常点影响较小的特点,CNNMS方法把高维基因特征映射到核空间,将所有样本与其近邻样本之间距离均值定义为样本的近邻均值,使跨模态近邻流形散布子空间在最大程度上保持同类特征内部的聚集性。实验结果表明,CNNMS方法在肺癌基因表达数据集上的分类识别率超过98%,在胃癌基因表达数据集上也获得了良好的分类识别率,相较于其他方法具有更好的分类能力。CNNMS方法在基因分类研究中表现出较高的识别率,对基因特征提取研究具有深远意义。

王孟明;张志鹏;侯雅魁;

安徽理工大学计算机科学与工程学院,安徽淮南232001

计算机与自动化

基因特征提取;典型相关分析;数据降维;基因分类;近邻散布;鉴别敏感;癌症诊断

《湖北民族大学学报(自然科学版)》 2024 (001)

P.59-63 / 5

国家自然科学基金项目(61806006);安徽省高等学校自然科学研究项目(2022AH040113,KJ2018A0083)。

10.13501/j.cnki.42-1908/n.2024.03.009

评论

下载量:0
点击量:0