学术科研

王晓聪讲述“分子构象描述符在开发分子力场电荷参数中的应用与优化”

发布日期:2021-03-18 发表者:陈治国 浏览次数:



   (图文|辛西)3月18日下午,第24期“Happy Hour”系列学术活动在逸夫楼C603会议室举行。太阳集团成生物信息系青年教师王晓聪博士作了题为“分子构象描述符在开发分子力场电荷参数中的应用与优化”的学术报告,吸引了诸多师生参与交流。


   王晓聪博士首先解释了分子构象描述符是机器学习方法在计算生物化学中应用的重要组成部分,并围绕在分子力场电荷参数开发中如何描述分子构象这一问题讲述了研究思路。由于在经典分子动力学模拟中,使用的是固定点电荷模型,无法体现由于构象变化引起的静电势变化,相互作用计算结果相对计算量大耗时长的高精度量子化学计算的结果来说也是不够准确的。使用机器学习模型可以快速且可靠地得到所需的电荷、能量等分子性质。机器学习的预测准确度很大程度依赖于作为输入的描述符,因此提供可以准确描述分子构象的描述符显得尤为重要。基于原子中心对称方程的方法生成的分子坐标,可以有效避免笛卡尔坐标平移和旋转时坐标改变问题;相较于库仑矩阵的方法,除了两两原子之间的相对距离,原子中心对称函数还增加了角度项来描述原子间的位置,可以更加准确的描述分子本身的化学结构和每个原子周围的化学环境。在原子中心对称方程的基础上,王晓聪博士进一步优化了对称方程的描述符,考虑到生物分子元素种类较少,按照元素对原子进行划分还不足以准确描述生物分子的复杂构象空间。因此引入了分子力场中的原子类型,按照原子类型对原子进行划分可以区别不同性质的同元素原子,对分子构象可以有更加合理的划分且具有良好的迁移性。优化的描述符方法在血红素简化模型、呋喃糖模型、偶氮苯模型中都得到了具体应用且都取得了不错的结果,表明该方法的合理性和准确度。原子类型由于广泛应用于分子力学的力场参数,所以使用原子类型对称函数的随机森林回归模型可以应用到分子动力学模拟中,实现对分子电荷的实时预测,在保证准确度的同时避免了量化计算带来的巨大计算量。


   张红雨经理对此次报告表现出浓厚兴趣,就该描述符优化方法进行了点评与后续应用的热切期待,李立教授就实际应用中的预测结果和随机森林模型进行了讨论交流,高军教授就实际应用中分子长度改变的问题提出了疑惑并积极交流,其余老师和同学也纷纷在报告结束后和王晓聪博士展开了交流讨论,本次交流会在积极的讨论交流中落下帷幕。