模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2018, Vol. 31 Issue (6): 562-568    DOI: 10.16451/j.cnki.issn1003-6059.201806009
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于卷积长短时记忆神经网络的蛋白质二级结构预测
郭延哺1, 李维华1, 王兵益2, 金宸1
1.云南大学 信息学院 昆明 650500
2.中国林业科学研究院 资源昆虫研究所 昆明 650224
Protein Secondary Structure Prediction Based on Convolutional Long Short-Time Memory Neural Networks
GUO Yanbu1, LI Weihua1, WANG Bingyi2, JIN Chen1
1.School of Information Science and Engineering, Yunnan University, Kunming 650500
2.The Research Institute of Resource Insects, Chinese Academy of Forestry, Kunming 650224

全文: PDF (789 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 

鉴于不同类型氨基酸的相互作用对蛋白质结构预测的影响不同,文中融合卷积神经网络和长短时记忆神经网络模型,提出卷积长短时记忆神经网络,并应用到蛋白质8类二级结构的预测中.首先基于氨基酸序列的类别信息和氨基酸结构的进化信息表示蛋白质序列,并采用卷积提取氨基酸残基之间的局部相关特征,然后利用双向长短时记忆神经网络提取蛋白质序列内部残基之间的远程相互作用,最后将提取的蛋白质的局部相关特征和远程相互作用用于蛋白质8类二级结构的预测.实验表明,相比基准方法,文中模型提高8类二级结构预测的精度,并具有良好的可扩展性.

服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
郭延哺
李维华
王兵益
金宸
关键词 生物信息学 蛋白质二级结构 卷积神经网络 长短时记忆神经网络    
Abstract

Since the interaction of different types of amino acid has an influence on the prediction of protein structure, convolutional neural networks and long short-term memory neural networks are integrated. A convolutional long short-term memory neural network is proposed to predict 8-class protein secondary structures. Firstly, the protein sequence is represented based on the amino acid sequence class feature and the amino acid structure profile feature. The local correlation characteristics between amino acid residues are extracted by the convolutional operations, and then the long-range interactions between the residues on protein sequences are extracted by the bi-directional long short-term memory network. Finally, the local correlation characteristics and long-range interactions between amino acid residues are employed to predict protein secondary structures. Experimental results show that the proposed model achieves a higher accuracy than the baselines and the framework has good scalability.

收稿日期: 2018-01-03     
ZTFLH: TP 391  
基金资助:

国家自然科学基金项目(No.11661081)、教育部科技发展中心“云数融合科教创新”基金(No.2017B00016)、云南省科技创新人才培养项目、云南省创新团队项目资助

作者简介: 郭延哺,硕士研究生,主要研究方向为深度学习、生物信息学.E-mail:guoyb213321@163.com. 李维华(通讯作者),博士,副教授,主要研究方向为数据挖掘、机器学习.E-mail:lywey@163.com. 王兵益,博士,副研究员,主要研究方向为植物分子生物学.E-mail:wbykm@aliyun.com. 金 宸,硕士研究生,主要研究方向为自然语言处理、机器学习.E-mail:chenjin0721@gmail.com.
引用本文:   
郭延哺, 李维华, 王兵益, 金宸. 基于卷积长短时记忆神经网络的蛋白质二级结构预测[J]. 模式识别与人工智能, 2018, 31(6): 562-568. GUO Yanbu, LI Weihua, WANG Bingyi, JIN Chen. Protein Secondary Structure Prediction Based on Convolutional Long Short-Time Memory Neural Networks. , 2018, 31(6): 562-568.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201806009      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2018/V31/I6/562
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn