新物质?新材料?探索元素周期表,机器学习帮你找
发现新的周期
铁头娃 发自 凹非寺
量子位 出品 | 公众号 QbitAI
你知道今年是元素周期表诞生150周年吗?
1869年,俄国化学家门捷列夫将当时已知的63种元素写在卡片上,根据化学和物理性质进行排列,形成了元素周期表的雏形。
目前常用的元素周期表是短式表,还有长式表,特长表,平面螺线表,圆形表,甚至还有立体周期表。
现在,科学家们利用机器学习,重新挖掘元素间的关系,探索元素周期表的新形式以及材料的新可能。
元素周期表,进化!
洛桑联邦理工大学的研究人员,就使用机器学习的方式,探索了元素周期表在高维表达的可能形式。
这些新的元素关系人类无法眼见为实,所以利用机器学习可以探索更多可能。
他们根据密度泛函理论导入了近11000种四元素化合物(形式为ABCx2Dx6)的结构作为数据集。
这些化合物的结构通过原子间的位置排布和化学性质,可以被划定为不同的特征向量。
除此之外,这些化合物包括39种主族元素,包括了很大一部分常见的化合物形式。
他们通过对确定低维度的特征值来对高维度的特征向量进行简化,就像数学中为了分析曲线性质来确定坐标系一样。
他们发现,一些特定元素在低维度会聚集在一起,
那么这个聚集现象是不是与元素在周期表中的位置相关呢?
研究者将这些元素的关系进行可视化处理后,发现这些元素的关系和之前人们推导的关系很接近:
惰性气体不跟主流元素一起玩,而且个个都是独行侠;
卤族元素是一家,代表颜色尽可能一致,碱金属有样学样也一起抱团;
同族元素中,最短周期元素和其他周期元素泾渭分明,氢元素作为元素周期表的老大,跟其他同组元素比显得更为突出。
从低维度向高维度的反推过程,也表现出类似的结果。
但是在特定的数据集内容限制下,元素之间的关系发生了偏移。
在钙钛矿中,第一主族元素依旧像以前一样扎堆,
但是氢元素在算法中表现的的性质开始偏向于氢化物,
这样的氢元素更容易脱离,并与卤族元素和硫族元素结合。
△ 图为微观钙钛矿
如果将原有平面三维化,那么氢元素和其他碱性金属同之前二维平面的结果相比,距离会变得更近。
这些结果不但契合了元素的基本分组理论和性质,并且元素的独特性质在三维平面中的表现。
也说明了根据元素的性质,元素周期表不只是二维的。
论文摘要去淘金!
加州劳伦斯-伯克利国家实验室的研究人员,则选择把材料领域作为机器学习的突破口,这个选择更为大胆。
他们尝试做一个巨量的材料结构和性质数据库,通过已知的材料性质与结构的关系,
来对可能出现的材料结构“淘金”,希望能够预测出新材料。
没有现成的理论,没有直观可行的数据,这条探索之路可以说伸手不见五指。
但是,
材料领域论文多啊!
于是他们利用了论文中出现的词汇作为他们的材料科学数据集,
分析文本的算法是现成的,并且在历史和文学方面也有应用。
所以他们录入了从1922年到2018年的330万篇摘要,扫描了五十万词汇,其中包括化学公式。
而机器学习的分析结果也是非常有趣的,例如镍化铁就与铁磁性挂钩,而铋化碲则与热电性质相关,这跟现实科学研究得出来的结论相符。
按照这个思路,就可以对根据之前机械学习的经验,对新材料的性质和应用进行分析。
甚至可以在新材料被发现之前,预测相关的研究方向。
机器学习,经验回归
为什么只是用机器学习对化学周期表和材料论文淘金,就值得如此重视呢?
因为这代表着化学的经验化研究方式,可以擦净历史的尘埃,重现光彩。
化学,在瓶瓶罐罐分析实验的背后,是一门经验化的科学,
这个学科所有的理论和经验,都是依靠不断的实验,统计和推翻,以及继续实验的循环不断确定的过程。
△ 图为拉瓦锡实验铜像
这个学科不能依靠宏观的理论推导,完美实现化学反应的预演。
另一方面,对新材料的探索和应用研究,还是无法避免依靠实验的经验总结过程。
人的总结能力终归是有限的,而机器学习则极大的拓展了研究者范例总结的边界。
化学的萌芽阶段,就是靠从粗浅的现象到深入的性质,进行逐步的经验总结。
而机器学习,即将把化学最开始的探索手段,实现出新的价值。