苏刚团队发表封面文章提出高通量计算结合机器学习
加速设计高性能光电材料新方法
凝聚态理论与计算材料物理实验室
光电材料是光电子工业的基石,探索新型高性能光电材料是凝聚态物理和材料科学研究人员关注的前沿研究领域之一。最近,我校苏刚研究团队提出基于高通量第一性原理计算结合机器学习方法,成功从5300个二维八面体氧卤化合物中筛选出无毒、廉价、稳定、高迁移率和高光吸收系数的性能优异的二维光电材料,克服了传统“试错法”存在的效率低下、资源浪费等问题。该项研究成果于近期发表在美国化学学会旗下的《物理化学快报》(Journal of Physical Chemistry Letters 2019, 10, 6734−6740),并被选为封面论文。文章标题为“Accelerated Discovery of Two-Dimensional Optoelectronic Octahedral Oxyhalides via High-Throughput Ab Initio Calculations and Machine Learning”。
图一、期刊封面图
为了克服传统“试错法”的弊端,基于量子力学的高通量计算已经应用到设计拓扑材料、压电材料、易剥离的材料等。但是少数性能优异的材料隐藏在成千上万的材料中,采用第一性原理计算方法会浪费大量资源且效率低下。而机器学习不仅能大大加快研发新型功能材料的进程,还能得到材料的“结构—物性”关系。高通量计算和机器学习两者的有机结合将会产生新的材料预测和设计方法,加快新型材料研发的进程。
自从2004年石墨烯诞生以来,二维材料因其独特的物理性质和潜在的纳米电子器件的应用引起科学界和工业界的广泛关注,但是设计具有合适带隙、高迁移率、高光吸收系数和稳定的二维光电材料则十分困难。最近,二维八面体氧卤化合物(OOHs)因其具有低的剥离能和半导体性质受到材料学家的大量关注。苏刚团队基于高通量第一性原理计算结合机器学习方法,通过引入畸变八面体因子,成功从5300个OOHs材料中筛选出性能优异的光电材料。他们通过高通量计算其中300个OOHs材料电子结构作为数据集,利用不同机器学习算法,训练机器学习模型得到最有效的模型,然后预测剩下5000个材料,再利用高通量计算筛选无毒、廉价、稳定、高迁移率和高光吸收系数的材料,最终得到了3种性能优异的光电材料。
图二、流程图
图三、OOHs结构示意图和机器学习结合高通量计算筛选流程图。图a、OOHs结构类型。图b、OOHs基本单元:上下堆积的畸变八面体和全部数据集。图c、左边:机器学习流程图和初步筛选流程,右边:高通量计算筛选流程。
OOHs材料具有上下堆积的畸变八面体结构,其中A原子位于其中心,X1/X2和B1/B2原子位于其顶点。通过氧族元素替换X1/X2位置原子,卤族元素替换B1/B2位置原子,图三(b)中53个元素替换A原子得到5300个材料(图三(a),(b))。研究人员从中随机选择300个材料进行高通量计算得到带隙值作为目标物理量,将元素基本性质以及结构因子作为特征变量,利用不同机器学习算法建立特征变量和目标物理量间的模型。发现梯度提升回归算法(GBR)拟合效果最佳,然后利用特征工程方法筛选得到最佳的26个特征变量(图四(a))。
研究团队首次提出了适合OOHs材料的结构因子—畸变八面体因子(DSOfs),该结构因子不同于传统钙钛矿材料的八面体因子,对于OOHs材料的预测至关重要(图四(a))。通过分析26个特征变量的关联性,研究人员得到“结构—物性”关系(图四(b))。
通过分析机器学习预测效果,GBR算法预测的标准差(MSE)只有0.086且有较高的决定系数(R2)0.835,而且76个OOHs的预测值和计算值基本一致,说明机器学习预测的结果合理。同时,5000个材料全部采用第一性原理计算需要耗时约600小时,但是利用机器学习仅需不到1秒,说明机器学习具有极高的加速比。
图四、所选特征变量重要性和相关性。图a、使用GBR算法对26个特征的重要性排序。图b、26个特征变量的关联性矩阵
利用GBR模型预测剩下的5000个材料得到411个满足光电带隙要求的材料,再进一步筛选得到73个无毒廉价的材料作为高通量计算的研究对象。按照稳定性、高电子迁移率和优于本征硅的光吸收系数等标准,最后筛选得到了3个性能优异的二维光电材料(Bi2Se2Br2, Bi2Se2BrI 和 Bi2Se2I2)。
以上三个光电材料均满足光电带隙的要求(图五(a)(c)(e)),具有极高的电子迁移率(约7.00×104 cm2/Vs)和较强的电子各向异性(图五(g)),可以应用到高速光电子器件,特别是阻变存储器件。同时,其光吸收系数和范围均远高于常见二维材料(如二硫化钼,黑磷)和本征硅材料(图五(b)(d)(f)),且光吸收谱基本覆盖了可见光区域,将在二维光电器件和太阳能电池中具有良好的应用前景。
综上所述,基于高通量计算和机器学习结合的方法,只需计算最有前景的材料,不同于传统高通量计算方法需要计算整个化学空间,可以极大减少搜索空间,极大地加快新型功能材料的预测和设计。此外,本项工作首次提出的畸变八面体结构因子可以启发构建其他复杂材料的结构因子,进而帮助建立机器学习模型。该方法也适用其他新型功能材料的设计与发现。
图五、三个光电材料的电子结构,载流子迁移率和光吸收的计算值。图(a)(c)(e)、三个光电材料的电子结构。图(b)(d)(f)、三个光电材料的光吸收谱以及二硫化钼,黑磷和本征硅的光吸收谱,黄色区域是可见光光谱范围。图(g)(h)、三个光电材料和黑磷沿x/y方向的载流子迁移率。
论文第一作者是国科大350vip浦京集团硕士研究生马星宇。该工作得到了中科院先导专项,科技部重点研发计划,北京市科学技术委员会和国家自然科学基金委等的资助。相关计算在中科院超算中心和国家超级计算广州中心天河二号平台上完成。