模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2024, Vol. 37 Issue (2): 181-190    DOI: 10.16451/j.cnki.issn1003-6059.202402007
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于BERT和CNN的致病剪接突变预测方法
宋程程1, 赵依然1, 李晓艳1, 夏俊峰1
1.安徽大学 物质科学与信息技术研究院 合肥 230601
BERT and CNN-Based Deleterious Splicing Mutation Prediction Method
SONG Chengcheng1, ZHAO Yiran1, LI Xiaoyan1, XIA Junfeng1
1. Institutes of Physical Science and Information Technology, Anhui University, Hefei 230601

全文: PDF (819 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 遗传诊断中的一个关键挑战是评估与剪接相关的致病遗传突变.现有致病剪接突变预测工具大多基于传统的机器学习方法,主要依赖人工提取的剪接特征,从而限制预测性能的提升,尤其对于非经典剪接突变,性能较差.因此,文中提出基于BERT(Bidirectional Encoder Representations from Transformers)和CNN(Convolutional Neural Network)的致病剪接突变预测方法(BERT and CNN-Based Deleterious Splicing Mutation Prediction Method, BCsplice).BCsplice中BERT模块可全面提取序列的上下文信息,与提取局部特征的CNN结合后,可充分学习序列的语义信息,预测剪接突变致病性.非经典剪接突变的影响往往更依赖序列上下文的深层语义信息,通过CNN将BERT的多级别语义信息进行组合提取,可获得丰富的信息表示,有助于识别非经典剪接突变.对比实验表明BCsplice性能较优,尤其是在非经典剪接区表现出一定性能优势,有助于识别致病剪接突变和临床遗传诊断.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
宋程程
赵依然
李晓艳
夏俊峰
关键词 致病剪接突变深度学习预测模型致病性预测    
Abstract:A key challenge in genetic diagnosis is the assessment of pathogenic genetic mutations related to splicing. Existing predictive tools for pathogenic splicing mutations are mostly based on traditional machine learning methods, heavily relying on manually extracted splicing features. Thereby the predictive performance is limited, especially for non-canonical splicing mutation producing poor performance. Therefore, a bidirectional encoder representations from transformers(BERT) and convolutional neural network(CNN)-based deleterious splicing mutation prediction method(BCsplice) is proposed. The BERT module in BCsplice comprehensively extracts contextual information of sequences. While combined with CNN that extracts local features, BERT module can adequately learn the semantic information of sequences and predict the pathogenicity of splicing mutations. The impact of non-canonical splicing mutations often relies more on deep semantic information of sequence context. By combining and extracting the multi-level semantic information of BERT through CNN, rich information representations can be obtained, aiding in the identification of non-canonical splicing mutations. Comparative experiments demonstrate the superior performance of BCsplice, especially exhibiting certain performance advantages in non-canonical splicing regions, and it contributes to the identification of pathogenic splicing mutations and clinical genetic diagnosis.
Key wordsDeleterious Splicing Mutation    Deep Learning    Prediction Model    Pathogenicity Prediction   
收稿日期: 2024-01-24     
ZTFLH: TP391  
基金资助:国家自然科学基金项目(No.U22A2038)资助
通讯作者: 夏俊峰,博士,教授,主要研究方向为生物信息学、机器学习.E-mail:jfxia@ahu.edu.cn.   
作者简介: 宋程程,硕士研究生,主要研究方向为生物信息学、深度学习.E-mail:1484311435@qq.com. 赵依然,硕士研究生,主要研究方向为生物信息学.E-mail:18811212175@163.com. 李晓艳,博士,讲师,主要研究方向为生物信息学.E-mail:lixiaoyan@ahu.edu.cn.
引用本文:   
宋程程, 赵依然, 李晓艳, 夏俊峰. 基于BERT和CNN的致病剪接突变预测方法[J]. 模式识别与人工智能, 2024, 37(2): 181-190. SONG Chengcheng, ZHAO Yiran, LI Xiaoyan, XIA Junfeng. BERT and CNN-Based Deleterious Splicing Mutation Prediction Method. Pattern Recognition and Artificial Intelligence, 2024, 37(2): 181-190.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202402007      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I2/181
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn