模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2017, Vol. 30 Issue (2): 106-116    DOI: 10.16451/j.cnki.issn1003-6059.201702002
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基因表达数据的低秩投影最小二乘回归子空间分割*
陈晓云,肖秉森,林莉媛
福州大学 数学与计算机科学学院 福州 350108
Low Rank Projection Least Square Regression Subspace Segmentation
for Gene Expression Data
CHEN Xiaoyun, XIAO Bingsen, LIN Liyuan
College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350108

全文: PDF (977 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 基因表达数据具有高维、小样本、多噪声和高冗余的特点,使传统聚类方法效率较低.子空间分割是高维数据聚类的有效手段,但直接对基因表达数据进行子空间分割会降低聚类性能.为了更有效地聚类,文中提出低秩投影最小二乘回归子空间分割方法.首先利用改进的低秩方法将数据投影至潜在子空间,以便去除数据中可能的毁损,得到较干净的数据字典.然后采用最小二乘回归方法获得数据低维表示并构造仿射矩阵,利用该仿射矩阵实现聚类.在6个公开基因表达数据集上的实验表明文中方法的有效性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈晓云
肖秉森
林莉媛
关键词 基因表达数据 聚类 最小二乘回归 子空间分割 低秩投影
    
Abstract:The traditional clustering methods are inefficient due to high dimension and redundancy, small sample size and noise of the gene expression data. Subspace segmentation is an effective method for high dimensional data clustering. However, the performance of clustering is reduced by using subspace segmentation on the gene expression data directly. To cluster the gene expression data more effectively, low rank projection least square regression subspace segmentation method(LPLSR) is proposed. The improved low rank method is utilized to project gene expression data into the latent subspace to remove the possible corruptions in data and get a relatively clean data dictionary. Then, least square regression method is employed to obtain the low-dimension representation for data vectors and the affinity matrix is constructed to cluster the gene data. The experimental results on six public gene expression datasets show the validity of the proposed method.
Key wordsGene Expression Data    Clustering    Least Square Regression    Subspace Segmentation    Low Rank Projection   
收稿日期: 2016-07-19     
ZTFLH: TP 311  
  TP 371  
基金资助:国家自然科学基金项目(No.11571074,71273053)、福建省自然科学基金项目(No.2014J01009)资助
作者简介: 陈晓云(通讯作者),女,1970年生,博士,教授,主要研究方向为数据挖掘、模式识别、机器学习等.E-mail:c_xiaoyun@21cn.com.
肖秉森,男,1992年生,硕士研究生,主要研究方向为数据挖掘、模式识别等.E-mail:723360870@qq.com.
林莉媛,女,1991年生,硕士研究生,主要研究方向为数据挖掘、模式识别等.E-mail:234781675@qq.com.
引用本文:   
陈晓云,肖秉森,林莉媛. 基因表达数据的低秩投影最小二乘回归子空间分割*[J]. 模式识别与人工智能, 2017, 30(2): 106-116. CHEN Xiaoyun, XIAO Bingsen, LIN Liyuan. Low Rank Projection Least Square Regression Subspace Segmentation
for Gene Expression Data. , 2017, 30(2): 106-116.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201702002      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2017/V30/I2/106
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn