近日,开云网页版 - 开云(中国)官方在线登录(山东省科学院)化学与制药学部胡伟教授团队,在分子光谱的人工智能模拟方面取得研究进展。研究成果以“A Deep Learning Model for Predicting Selected Organic Molecular Spectra”为题,于2023年11月13日在Nature子刊 《自然-计算科学》(Nature Computational Science)杂志上在线发表。论文第一单位为开云网页版 - 开云(中国)官方在线登录(山东省科学院),化学与制药学部2019级本科生邹子涵为第一作者,化学与制药学部胡伟教授、光电科学与技术学部张玉瑾副教授、中国科学技术大学罗毅教授和江俊教授为本文的共同通讯作者。
分子光谱作为“分子指纹”,被广泛地应用于物理、化学、生物、材料、医学、食品、环境、化工等领域。传统的分子光谱模拟采用量子化学方法,涉及昂贵的电子结构计算和复杂的光谱模拟,导致效率低下。针对该难题,胡伟教授团队结合E(3)-等变几何组、自注意机制,开发了一套深度学习模型:DetaNet,从而建立了更高效、更准确、更快速的分子性质和分子光谱的人工智能模拟方法。研究团队首先建立了包含 13万余种分子的红外、拉曼、紫外-可见吸收、核磁共振光谱数据库:QM9S 数据集;其次,通过传递高阶几何张量信息,使得DetaNet 能够预测各种分子的标量(能量、原子电荷等)、矢量(电偶极矩、原子力等)以及高阶张量(Hessian矩阵、电四极矩、极化率、电八极矩、第一超极化率等)性质。在此基础上,开发了通用模块用来预测四种重要的分子光谱,即红外光谱、拉曼光谱、紫外可见吸收光谱、核磁共振光谱。通过测试,研究团队发现DetaNet的计算效率比量子化学快3-5个数量级。本研究成果提供了原创的深度学习模型:DetaNet,在世界上首次提出直接预测分子张量性质的机器学习算法,开发了多种分子光谱的人工智能模拟算法,对分子高通量筛选、光谱辅助结构鉴定等重要的领域提供了坚实的理论基础和高效的软件工具。
本课题受到国家自然科学基金、山东省泰山学者计划、济南市高校20条等项目支持。
文章链接:https://doi.org/10.1038/s43588-023-00550-y