模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2014, Vol. 27 Issue (3): 206-212    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于MapReduce的基因读段定位算法
涂金金,杨明,郭丽娜
南京师范大学 计算机科学与技术学院 南京 210023
Gene Read Mapping Algorithms Based on MapReduce
TU Jin-Jin,YANG Ming,GUO Li-Na
School of Computer Science and Technology,Nanjing Normal University,Nanjing 210046

全文: PDF (0 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 RNA-seq测序技术的高速发展所产生的海量数据在执行效率上给原有读段定位算法带来严峻的挑战.为此,提出基于MapReduce的不跨越剪切位的空位种子索引算法(PSeqMap)和跨越剪切位的空位种子索引算法(PJuncSeqMap),以及一种负载平衡解决方案.该算法利用MapReduce框架实现空位种子索引算法的并行化,在拟南芥菜基因数据集上的实验结果表明文中提出的算法能够充分利用集群的存储和计算能力,高效处理海量基因数据.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
涂金金
杨明
郭丽娜
关键词 读段定位SeqMapMapReduce    
Abstract:Massive data generated by the rapid development of RNA-seq sequencing technology make serious challenges to the original read mapping algorithm in the efficiency. A spaced seed indexing algorithm without considering splice site based on MapReduce(PSeqMap),a spaced seed indexingalgorithm considering splice site(PJuncSeqMap),and a load-balancing solution are proposed. The MapReduce framework is employed to parallelize spaced seed indexing algorithms. The experimental results on the Arabidopsis gene datasets show that the proposed algorithms take full advantage of storage and computing power of the clusters and process massive genetic data efficiently.
收稿日期: 2013-06-05     
ZTFLH: TP 311  
基金资助:国家自然科学基金项目(No.61272222、61003116)、江苏省自然科学基金重点重大专项项目(No.BK2011005)、江苏省自然科学基金项目(No.BK2011782)、江苏省普通高校研究生科研创新计划项目(No.CXLX12_0415)资助。
作者简介: 涂金金,男,1988年生,硕士研究生,主要研究方向为机器学习、模式识别.E-mail:tujinjin1988@sina.com.杨明(通讯作者),男,1964年生,博士,教授,主要研究方向为机器学习、模式识别.E-mail:myang@njnu.edu.cn.郭丽娜,女,1989年生,硕士研究生,主要研究方向为机器学习、模式识别.
引用本文:   
涂金金,杨明,郭丽娜. 基于MapReduce的基因读段定位算法[J]. 模式识别与人工智能, 2014, 27(3): 206-212. TU Jin-Jin,YANG Ming,GUO Li-Na. Gene Read Mapping Algorithms Based on MapReduce. , 2014, 27(3): 206-212.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2014/V27/I3/206
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn