近日, 上海交通大学密西根学院助理教授贺玉莲课题组在国际综合性顶级期刊《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America,通常简称为PNAS)发表题为Interpreting Chemisorption Strength with AutoML-based Feature Deletion Experiments (基于自动机器学习算法的特征删除实验助力化学吸附能强度解析)的研究论文。研究成果在催化剂设计优化方面有着重要意义,并在方法学上产生重要的影响。
此篇发表在PNAS上的文章针对于确定决定催化剂表面上反应物的化学吸附能量Eads的关键物理量提出了一种新方法,即基于自动机器学习(AutoML)的特征删除实验,从高通量密度泛函理论(DFT)数据库中实现了知识的自动提取。Eads是理解和确定最佳催化剂的最具信息量的特征之一,但催化剂表面和化学吸附反应的内在复杂性使得确定决定Eads的关键物理量存在显著困难。研究团队发现,对于二元合金催化剂表面,吸附位点的局部几何信息为决定Eads的关键物理量,而不是合金催化剂的本征电子或者物理化学性质。研究通过将特征删除实验与基于神经网络的可解释人工智能(XAI)工具实例化变量选择(INVASE)相结合,总结出了对于预测Eads的最佳特征集,包含有21个固有的、非DFT计算的本征物理量。利用该特征集,在涉及1600余种的合金表面的约8400个化学吸附反应中,实现了0.23eV的平均绝对误差(MAE)。
研究论文论证了在二元合金催化剂表面的吸附位点的局部几何信息对化学吸附能量Eads的重要影响,展示了基于AutoML的特征删除实验的稳定性、一致性和潜力。与传统的可解释性模型相比,该方法避免了模型复杂性与可解释性之间的折衷,将科学见解的来源从阐明模型行为转移到评估特征集性能,最小化了人为干扰对于结论的影响,从对输出的统计行为中提取知识。这种策略使得科学见解的来源更加贴近传统实验科学中用于建立物理见解的方法,有望为提取其他研究方向的知识提供一条可行的路径。
密院助理教授贺玉莲与交大安泰经济与管理学院副教授花成为论文的通讯作者,论文的第一作者为密院博士后李卓,本科生赵长泉、王海焜为共同第二作者,丁琰青、陈也超、南开大学阳科教授和洛桑联邦理工学院Philippe Schwaller教授为本文共同作者。论文研究项目获国家自然科学基金委青年基金、重大研究计划、上海市科委以及上海市晨光计划资助。
文章链接:https://www.pnas.org/doi/10.1073/pnas.2320232121
作者简介
李卓,上海交通大学密西根学院博士后,本科毕业于北京大学,硕士与博士均毕业于罗切斯特大学。曾获2022年上海交通大学晨星博士后、2024年教育部博士后海外引才计划等荣誉。
赵长泉,上海交通大学数学科学学院大四学生,即将在密院攻读博士学位。研究领域主要包括催化剂设计优化。
王海焜,上海交通大学安泰经济与管理学院大四学生,即将攻读上海交通大学硕士学位。研究领域主要包括机器学习。
丁琰青,上海交通大学化学化工学院22届本科毕业生,目前已在哥伦比亚大学获得硕士学位。
陈也超,上海交通大学安泰经济与管理学院大四学生,研究领域主要包括机器学习和深度学习。
通讯作者简介
贺玉莲,上海交通大学密西根学院、化学化工学院双聘助理教授。博士毕业于美国耶鲁大学化学与环境工程学院。发表SCI论文三十余篇,受邀出版书籍章节4部。研究方向包括催化剂合成与设计,碳一催化,多相催化,构效关系,催化氧化,加氢反应,数据驱动催化剂理性设计。获国家自然科学基金委,国家发改委,上海市科委,企业等多方资助。
花成,上海交通大学安泰经济与管理学院副教授。他本科毕业于上海交通大学,并于耶鲁大学商学院获得了博士学位。在Manufacturing & Service Operations Management,Naval Research Logistics,Transportation Research Part E 等国际知名期刊发表学术论文多篇。共获得7次管理科学与运筹学国际论文奖,还曾获得上海交通大学凯原十佳教师提名与上海交通大学最受本科生欢迎教师等荣誉。研究方向包括数据驱动决策,随机过程与近似算法,医疗优化管理,服务系统,机器学习与人工智能。