喜讯 | 竺立哲教授团队在著名期刊 J. Chem. Theory Comput. 发表封面文章
竺立哲教授团队
在著名期刊
Journal of Chemical Theory and Computation
发表封面文章
近日,香港中文大学(深圳)生命与健康科学学院、瓦谢尔计算生物研究院竺立哲教授研究组在知名国际期刊Journal of Chemical Theory and Computation发表封面文章 “Assessing the performance of Traveling-salesman based Automated Path Searching (TAPS) on complex biomolecular systems”,展示了自研的自动化路径搜索算法TAPS的易用性及整体效率。基于此,该方法有望成为研究复杂生物大分子功能性构象变化机制的通用方法,并在药物研发、蛋白质工程等领域发挥重要作用。
香港中文大学(深圳)生命与健康科学学院为第一单位,生命与健康科学学院瓦谢尔计算生物研究院席昆博士为论文的第一作者,竺立哲教授为通讯作者,另有胡祯全博士和三位香港中文大学(深圳)本科生参与此项工作。
01 研究简介
生物大分子的功能实现往往伴随着重要的结构转变,但现有的实验方法很难获取此转变过程的完整细节,需借助分子动力学模拟予以呈现。然而,受生物大分子本身的复杂性及计算资源所限,普通分子动力学模拟的长度只能达到微秒级别,远低于生物大分子功能性构象变化所需毫秒级以上的时间尺度,无法直接被用于观测该过程。为此,人们研发了各种算法,期以较小的代价,获得可准确描述这些构象变化的最大概率(最小自由能)路径。但这些算法大都非常依赖于事先对变化过程机制的猜测,自动化程度和整体效率较低(见图1)。
图1:TAPS与其他路径搜索方法的思路比较。(A) TAPS使用正交方向采样快速搜索最小自由能路径,并用旅行商求解器解决因此带来的路径节点顺序重排问题;(B) TAPS基于路径变量PCV,而非其他方法那样需要事先根据对构象变化机制的猜测定义静态坐标空间,从而降低了输入参数数量,将对机理的猜测和解释从采样搜索过程最大限度地剥离出来,提高了自动化程度。
这些方法通常先通过各种增强采样算法得到一条猜测的初始路径,而后基于对机理的猜测来选定具有物理意义的坐标变量(Collective Variable,CV),在此变量空间内进行路径搜索,找到初始猜测路径附近的最小自由能路径(图1B)。上述传统路径搜索方法的整体效率主要受限于两个因素:(a) 其路径上节点周围的采样通常是局部的,导致路径向最小自由能路径的演化非常缓慢;(b) 路径本身定义在先验选择的低维坐标变量 (CV) 空间,严重依赖于对系统的先验性知识,而这对于高维度的复杂生物大分子系统异常困难。
图2:经TAPS所得Lymphotactin从Ltn40态变至Ltn10态的最小自由能路径。
TAPS方法则直击这些痛点。首先,TAPS采用非局部采样,可进行垂直于猜测路径的快速搜索,并用旅行商求解器解决因此带来的路径节点顺序重排问题,提高了搜索效率(图1A)。另外,TAPS实现了高度自动化,即无需进行预选择的静态集体变量空间定义,而是通过定义描述高维构象间的距离(RMSD),来计算得到路径变量 (Path Collective Variable,PCV),进而在此高维空间搜索得到最小自由能路径,而后再依据所得高维路径准确提取与结构变化机制关联紧密的坐标信息(图1B),从而最大限度地将对机制的猜测和解释从搜索采样过程中剥离出来。
本研究基于Python3,实现了TAPS采样过程的并行化和GPU加速(https://github.com/xikun2020/TAPS),新增了可快速评估路径搜索是否收敛的计算模块,增加了方法的通用性与易用性。基于此平台,本研究全面揭示了三种蛋白质的重要功能性构象变化机制,即T4 Lysozyme L99A由基态(State G)转变为激活态(State E)、激酶分子MEK1从Loop-Out状态到达Loop-In状态以及对温度敏感的淋巴趋化因子Lymphotactin(Ltn)由Ltn40到Ltn10的转变机制。其中,尤以Ltn体系涉及大量二级结构变化最为复杂,但TAPS只需126ns的采样总量便获得了Ltn40至Ltn10的最小自由能路径,揭示了此转变中结构去折叠与再折叠的具体机制,获取了关键中间态和过渡态结构(见图2)。
鉴于其高效自动化的特征,TAPS算法为建立一套研究复杂生物大分子构象变化的通用算法平台提供了坚实基础。完善该平台则有赖于对TAPS的进一步优化。首先,由于 TAPS中的路径定义在高维空间、所含节点是完整的分子体系,我们还可根据所得路径节点的特征,更新定义RMSD所需的原子集,在路径搜索过程中自动完成计算RMSD的原子集的优化,进一步提升自动化程度。此外,由于生物大分子的构象变化过程常存在多条并行路径,如何以低成本一次性获得多条最小自由能路径也将是TAPS平台下一步发展的重要课题。
02 项目主持人
竺立哲博士,现为香港中文大学(深圳)生命与健康科学学院与瓦谢尔计算生物研究院助理教授。竺教授毕业于阿姆斯特丹大学化学系,彼时作为玛丽居里青年研究员,通过分子模拟手段研究蛋白质受体异位效应的机理,后于2012年赴香港科技大学从事博士后研究,致力于增强抽样算法同马尔可夫态模型方法的整合,至今已在国际主流期刊发表论文近30篇,总引用近400次(Google Scholar)。竺教授目前的研究兴趣包括机器学习与增强采样算法的融合、核酸与蛋白质相互作用、基因编辑工具的动力学机制、膜蛋白药物研发等。
封面内容:
https://pubs.acs.org/toc/jctcce/17/8
论文详情:
https://pubs.acs.org/doi/10.1021/acs.jctc.1c00182