课题组研究生在npj Comput. Mater.期刊发表研究论文

2023.10.22 495

近日,课题组博士生在国际计算材料领域权威期刊《npj Computational Materials》发表题为“Exploring high thermal conductivity polymers via interpretable machine learning with physical descriptors”的研究论文,建立了聚合物微观层次结构与导热性能的统一联系。

本征聚合物的低导热特征所导致的散热问题与其在集成电路封装及有机半导体领域的广泛应用需求相矛盾。但受到聚合物合成复杂的工艺及高昂的成本,公开的可靠聚合物热导率数据十分稀少。这严重阻碍了对于聚合微观结构与导热性能之间映射关系的理解及高导热聚合物的开发进程。鉴于此,本研究设计了新颖的集成物理特征工程、可解释机器学习与符号回归技术的数据驱动框架,以高通量分子动力学计算的聚合物热导率数据为基础,结合从分子单体原子和电子结构等信息提取的物理描述符构建模型,从而建立聚合物微观构型与热导率的完整映射,实现了高导热聚合物链的高效筛选。

1 基于可解释机器学习的高导热聚合物筛选流程框架

为了建立准确的微观结构-导热性能的关系,本文首先设计了聚合物物理描述算子及递归筛选优化流程,将320个从单体结构的微观电子结构、原子信息及力场参数提取的物理描述符,通过皮尔森(Pearson)系数、斯皮尔曼(spearman)系数、距离系数和最大互信息熵统计学参数及100次随机序列特征筛选最终降维到20个优化描述符,且所训练的机器学习模型预测精度R2均大于0.80,优于Morgan指纹和分子访问系统(MACCS)等传统图表示方法。

聚合物描述符递归筛选及机器学习模型训练:(a) 通过递归筛选得到的20个优化描述符;(b) 优化描述符训练的随机森林模型;(c) 和 (d) 不同递归筛选阶段和不同表示方法训练的机器学习模型精度比较;(e)特征热图用于表示优化描述符与热导率的互相关性

图3所示为基于SHAP值描述符重要性分析。在重要性排序前8的描述符中,基于Mordred软件获取和力场参数提取的描述符各占一半,这表明我们所使用的描述符综合搜集策略是有效的。不同的描述符对热导率的促进或抑制作用可以在图中分析得到。以熟悉的截面积和二面角力常数为例,当聚合物有着较小的截面积时,其热流在沿链方向有着更小的损耗,有望获得大的热导率。同样的,较大的二面角力常数表示聚合物链刚度较大,这也更加利于热流的传输和得到大的热导率。但是,聚合物的热导率受到多个参数相互作用和影响,难以通过单一的物理描述符确定其对应热导率的高低趋势。

图3 聚合物特征重要性分析:(a) 基于SHAP的特征重要性排序;(b) 训练结构的特征值与SHAP值得分布关系; (c) 和 (d) 聚合物训练数据的SHAP值随截面积及二面角力常数的变化

为了得到更多具有高导热性能的聚合物结构,将训练的随机森林(RF)、极端梯度提升(XGBoost)和多层感知机(MLP)模型分别用于预测PLyInfo和PI1M聚合物数据库中聚合物结构的热导率预测。对比可知,基于MLP预测得到的聚合物热导率较RF与XGBoost对应的结果有着更加宽泛的分布范围。尽管树状模型在防止过拟合方面表现出色,但模型的外推能力通常是不充分的,预测结果仍然局限于训练集中聚合物结构的热导率范围。相比之下,MLP的神经网络模型通常具有更好的外推能力,即使模型的训练精度R2相对较低,但在寻找高热导率聚合物结构等“小数据”方面具有优势。在这里,热导率大于20 W m-1K-1的聚合物链(长度为50 nm)被认为是具有高导热性能的结构。最终,通过高保真分子动力学验证得到107个结构热导率大于20 W m-1K-1,其中29个合成可行性分数(SA score)小于3,如图4所示。合成可行性分数是用于表征有机分子合成难易程度的,其范围1~10。其中,SA score越接近1,表明有机物的可合成性是越高的。

图4 高导热聚合物的高通量筛选:(a), (b) 和 (c) 随机森林(RF)、极端梯度提升(XGBoost)和多层感知机(MLP)模型用于PoLyInfo和PI1M数据库中聚合物结构的热导率预测;(d)高导热聚合物链的可合成分数(SA score)与热导率关系

进一步地,我们从107个结构中选取了58单体用于计算对应非晶体系的热导率。其中,热导率大于0.40 W m-1K-1的非晶聚合物占比达一半,远超于Hayashi等人计算的参考数据对应占比(2.3%)。这项工作计算的58个聚合物结构的回转半径Rg拓宽了参考数据的Rg上限,这表明具有大的热导率的聚合物链其内部强的原子间相互作用有利于非晶系统产生大的刚性链段。如图5所示,选取了六种具有不同回转半径的典型非晶聚合物结构,包括聚(对苯)(PPP)、聚(对苯乙烯)(PPPV)、聚乙炔(PA)、聚[(E)-1-氟乙烯-1,2-二基](PEFD)、聚乙烯(PE)和聚四氟乙烯(PTFE)进行了讨论。通过热流分解技术将聚合物的非晶热导率定量分解为键、角、二面角(dihed)、对流(conv)、非键(non)和离面角作用六个部分的贡献。结果表明,键、角及二面角等链内相互作用依然是非晶聚合物热导率的主要贡献来源,特别是对于π共轭聚合物,二面角项对非晶聚合物热导率的直接贡献是显而易见的。通过比较PA/PEFD或PE/PTFE组合,反映了含有氟等大质量原子的体系可能会抑制声子的传播并降低非晶聚合物热导。此部分工作加强了聚合物链及非晶聚合物热输运之间联系的理解。

图5 非晶聚合物的导热率: (a) 58个非晶结构的热导率分布与1071个Hayashi等人计算的参考聚合物热导数据用于比较;(b) 本工作和参考文献中聚合物的回旋半径(Rg)与热导率的关系,其中菱形标记表示(c)中的六种典型无定形聚合物,包括聚(对苯)(PPP)、聚(对苯乙烯)(PPPV)、聚乙炔(PA)、聚[(E)-1-氟乙烯-1,2-二基](PEFD)、聚乙烯(PE)和聚四氟乙烯(PTFE);(d) 对流和不同类型的相互作用对六种聚合物热导率的贡献。每种无定形聚合物的热导率被量化为键、角、二面角(dihed)、对流(conv)、非键(non)和离面角作用六个组成部分

本论文所提出的研究方法可以进一步推广,为聚合物结构和性能关系的探究提供了行之有效的思路,也为指导高性能聚合物的设计提供高效的方案。

原文链接:https://www.nature.com/articles/s41524-023-01154-w

上海交通大学中英国际低碳学院2020级博士研究生黄翔和2021级博士研究生马圣荦为本论文共同第一作者,通讯作者是鞠生宏副教授。