模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2014, Vol. 27 Issue (4): 327-336    DOI:
综述与评论 最新目录| 下期目录| 过刊浏览| 高级检索 |
大数据下的机器学习算法综述
何清1,李宁1,2,3,罗文娟1,2,史忠植1
1.中国科学院计算技术研究所智能信息处理重点实验室北京100190
2.中国科学院大学北京100049
3.河北大学数学与计算机学院保定071002
A Survey of Machine Learning Algorithms for Big Data
HE Qing1, LI Ning1,2,3, LUO Wen-Juan1,2, SHI Zhong-Zhi1
1.Key Laboratory of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190
2.University of Chinese Academy of Sciences, Beijing 100049
3.College of Mathematics and Computer Science, Hebei University, Baoding 071002

全文: PDF (525 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题.文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题.最后指出大数据机器学习的研究趋势.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
何清
李宁
罗文娟
史忠植
关键词 大数据机器学习分类聚类并行算法    
Abstract:With the explosive growth of the industry data, more and more attention is paid to big data. However, due to the volume, complex and fast-changing characteristics of big data, traditional machine learning algorithms for small data are not applicable. Therefore, developing machine learning algorithms for big data is a research focus. In this paper, the state-of-the-art machine learning techniques for big data are introduced and analyzed. As parallelism is a mainstream strategy for applying machine learning algorithms to big data, some parallelism strategies are described in detail as well. Finally, the challenges of applying machine learning to big data and some interesting research trends of machine learning in big data are pointed out.
Key wordsBig Data    Machine Learning    Classification    Clustering    Parallel Algorithm   
收稿日期: 2013-06-05     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61175052,61203297,61035003,61363058)、国家863计划项目(No.2014AA012205,2013AA01A606,2012AA011003)资助。
作者简介: 何清,男,1965年生,研究员,博士生导师,主要研究方向为机器学习、数据挖掘、基于云计算的海量数据挖掘.李宁(通讯作者),女,1982年生,博士研究生,主要研究方向为文本挖掘、机器学习.E-mail:lin@ics.ict.ac.cn.罗文娟,女,1987年生,博士研究生,主要研究方向为文本挖掘、机器学习.史忠植,男,1941年生,研究员,博士生导师,主要研究方向为人工智能.
引用本文:   
何清,李宁,罗文娟,史忠植. 大数据下的机器学习算法综述[J]. 模式识别与人工智能, 2014, 27(4): 327-336. HE Qing, LI Ning, LUO Wen-Juan, SHI Zhong-Zhi. A Survey of Machine Learning Algorithms for Big Data. , 2014, 27(4): 327-336.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2014/V27/I4/327
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn