科研进展

李富义教授课题组在蛋白质功能注释研究上取得新进展

作者:  来源:  发布日期:2025-12-01  浏览次数:


近日,信息工程学院智能计算与农业信息系统学科团队李富义教授课题组在蛋白质功能注释研究方面取得重要进展,研究成果以“A scalable equivariant graph network framework for precise protein function prediction”为题发表在《Genome Biology》(西北农林科技大学G1类期刊,中科院1区)。课题组硕士研究生冉子旭、博士研究生生郭旭东和澳大利亚Monash大学博士研究生潘彤为论文共同第一作者,李富义教授为通讯作者,澳大利亚Monash大学Jiangning Song教授为并列通讯作者,论文第一单位为西北农林科技大学信息工程学院。

图1 ENGINE模型框架图

蛋白质功能研究有助于理解细胞内发生的复杂生物过程。然而,蛋白质结构与功能的复杂性,以及蛋白质序列数据的快速增长,使得开发高效计算方法进行精准蛋白质注释成为迫切挑战。该研究提出ENGINE多通道深度学习框架,旨在实现稳健的蛋白质功能预测。ENGINE采用等变图卷积网络捕捉蛋白质的三维结构特征,借助蛋白质大语言模型(ESM-C和Foldseek)提取进化信息和表征三维序列,实现空间结构与序列信息的统一整合。

图2 ENGINE揭示了功能特异性的蛋白质二级结构特征与子结构

实验结果表明,ENGINE在蛋白质功能预测基准测试中超越现有方法,展现出强大的泛化能力与高预测精度。除性能优势外,ENGINE分析了可解释的关键结构特征,助力识别未注释的蛋白功能。同时,注意力机制的融入使ENGINE能精准定位参与多样化生物活性的关键残基,实现残基层面的功能注释。通过提供具有生物学可解释性的可靠预测,ENGINE为推进细胞过程和疾病机制的研究做出了贡献。为了便于研究人员轻松复现并拓展该工作,ENGINE已经开源,并在GitHub (https://github.com/ABILiLab/ENGINE) 和Zenodo (https://doi.org/10.5281/zenodo.17221153) 上提供配备了图形用户界面(GUI)的计算软件和源代码。此外,课题组面向校内用户提供批量计算服务。

该研究得到了国家自然科学基金[62202388]、国家重点研发计划[2022YFF1000100]和秦创原创新创业人才项目[QCYRCXM-2022–230]的支持。

论文链接:https://rdcu.be/eSnla