模式识别与人工智能
2025年4月5日 星期六   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2016, Vol. 29 Issue (7): 590-597    DOI: 10.16451/j.cnki.issn1003-6059.201607002
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于粒化-融合的海量高维数据特征选择算法*
冀素琴,石洪波,吕亚丽,郭珉
山西财经大学 信息管理学院 太原 030006
Feature Selection Algorithm Based onGranulation-Fusion for Massive High-Dimension Data
JI Suqin, SHI Hongbo, Lü Yali, GUO Min
Faculty of Information Management, Shanxi University of Finance and Economics, Taiyuan 030006

全文: PDF (421 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 基于粒计算视角,提出粒化-融合框架下的海量高维数据特征选择算法.运用BLB(Bag of Little Bootstrap)的思想,首先将原始海量数据集粒化为小规模数据子集(粒),然后在每个粒上构建多个自助子集的套索模型,实现粒特征选择,最后,各粒特征选择结果按权重融合、排序,得到原始数据集的有序特征选择结果.人工数据集和真实数据集上的实验表明文中算法对海量高维数据集进行特征选择的可行性和有效性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
冀素琴
石洪波
吕亚丽
郭珉
关键词 海量高维数据特征选择粒计算套索(LASSO)    
Abstract:From a granular computing perspective, a feature selection algorithm based on granulation-fusion for massive and high-dimension data is proposed. By applying bag of little Bootstrap (BLB), the original massive dataset is granulated into small subsets of data (granularity), and then features are selected by constructing multiple least absolute shrinkage and selection operator(LASSO) models on each granularity. Finally, features selected on each granularity are fused with different weights, and feature selection results are obtained on original dataset through ordering. Experimental results on artificial datasets and real datasets show that the proposed algorithm is feasible and effective for massive high-dimension datasets.
Key wordsMassive High-Dimensional Data    Feature Selection    Granular Computing    Least Absolute Shrinkage and Selection Operator (LASSO)   
收稿日期: 2016-02-08     
ZTFLH: TP 311.13  
基金资助:国家自然科学基金项目(No.60873100)、山西省自然科学基金项目(No.2014011022-2,2013011016-4)、中国博士后科学基金面上项目(No.2016M591409)资助
作者简介: 冀素琴(通讯作者),女,1972年生,硕士,讲师,主要研究方向为数据挖掘、分布式技术.E-mail:jsq58@sina.com. 石洪波,女,1965年生,博士,教授,主要研究方向为机器学习、数据挖掘.E-mail:shb710@163.com.吕亚丽,女,1975年生,博士,副教授,主要研究方向为人工智能、数据挖掘.E-mail:yali.lv2008@gmail.com. 郭 珉,女,1978年生,博士研究生,讲师,主要研究方向为应用统计.E-mail:guomin9617@163.com.
引用本文:   
冀素琴,石洪波,吕亚丽,郭珉. 基于粒化-融合的海量高维数据特征选择算法*[J]. 模式识别与人工智能, 2016, 29(7): 590-597. JI Suqin, SHI Hongbo, Lü Yali, GUO Min. Feature Selection Algorithm Based onGranulation-Fusion for Massive High-Dimension Data. , 2016, 29(7): 590-597.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201607002      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2016/V29/I7/590
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn