English Version

首页» 新闻中心» 新闻快讯

生命科学学院庞尔丽教授课题组在Briefings in Bioinformatics上发表无参可变剪切的预测方法

20231013日,庞尔丽教授课题组在Briefings in Bioinformatics年影响因子10.6发表题为MkcDBGAS: a reference-free approach to identify comprehensive alternative splicing events in a transcriptome研究论文,提出了在无参考基因组的情况下,识别可变剪切的方法。

可变剪切(alternative splicing一种重要的转录后修饰机制,调节许多生物过程同时是表型多样性的重要来源,对生物的环境适应和进化发挥重要作用。然而,在没有参考基因组指导下识别可变剪切事件仍然是一个挑战。

本研究提出了一种新的方法—MkcDBGAS,在没有参考基因组的情况下,只利用转录组来识别所有七种类型的可变剪切事件MkcDBGAS由三个模块组成(图1,分别利用人类和拟南芥的全长转录本构建了两个模型。在第一个模块中,MkcDBGAS首次使用混合kmers着色de Bruijn 来识别由于可变剪切而产生的气泡(bubbles在人类和拟南芥的转录组,准确分别98.17%99.31%召回率93.45%95.34%;并且可以识别它方法所不能识别的可变剪切事件第二个模块中, MkcDBGAS首次使用外显子的基序motifs构建特征矩阵,基于XGBoost的分类器对可变剪切事件进行分类,极大的提升了分类器的正确率人类和拟南芥模型正确率分别达93.44%94.09%并且于其的机器学习模型和分类方法(图2在第三个模块中,转录本表达量数据可以获得时MkcDBGAS提供了多种条件下差异可变剪切的分析。MkcDBGAS应用于人类的两个细胞系(PC3EGS689)、老鼠的转录组和无油Amborella三代测序(isoform sequencingIso-Seq转录组4个真实数据集中,可变剪切转录本识别准确都达到98.37%以上,召回率高于93.02%分类正确率都高于90.96%说明MkcDBGAS度可扩展的,可以应用于其他物种中MkcDBGAS首次仅利用转录组数据来识别所有类型的可变剪切事件,极大地促进可变剪切更广泛领域研究

北京师范大学生命科学学院生态系已毕业博士研究生张泉宝为论文第一作者,已毕业硕士研究曹磊、宋宏涛博士林魁教授参与了研究生物多样性与生态工程教育部重点实验室庞尔丽教授为论文的通讯作者该研究得到了国家自然科学基金中央高校基本科研业务费专项资金的资助。



1 MkcDBGAS工作流程A-D)混合kmers着色de Bruijn 识别可变剪切转录本。E)基于XGBoost可变剪切事件的分类器。F)差异可变剪切分析



2 MkcDBGAS分类表现

原文链接:https://academic.oup.com/bib/article/24/6/bbad367/7313457



北京师范大学版权所有 联系地址:北京市海淀区新街口外大街19号 北京师范大学生物多样性与生态工程教育部重点实验室 邮编100875