《自然》:不需要休息的AI“化学家”来了!全自动合成新材料,一天抵人类几个月
无论我们是否愿意,人工智能(AI)正给科学界带来革命性的变化。在生物学领域,AlphaFold等AI系统解决了持续半个世纪的蛋白质折叠难题后,已经能够预测出地球上几乎所有蛋白质结构;此后,AI设计蛋白质的速度与策略也实现了颠覆性的飞跃。药学领域,AI辅助药物研发已经迈入临床阶段。在化学与材料领域,AI也给我们带来了不小的震撼。2020年,《自然》杂志就曾报道了一种能自行决定实验计划的智能科学机器人,这种几乎不需要休息的科研机器,在8天内做完了近700项化学实验。
最近,AI“实验科学家”的恐怖能力有望再次改写化学研究的格局。在两项发表于《自然》杂志的研究中,AI平台分别提升了发现全新无机化合物,以及合成这些化合物的惊人速度与准确性。根据《自然》网站的报道,在无机化合物的合成方面,科研人员几个月的工作量,AI不到一天就能完成。
无机化合物的检索与合成需要繁重的实验室工作。目前化学家们已经合成了数十万种无机化合物,但有研究预测,还有数十亿种无机化合物材料等待发现,我们已经得到的材料甚至连冰山一角都算不上。
如何加速对这些全新材料的搜寻?随着计算科学以及AI的发展,一种思路是通过计算模拟全新的无机化合物材料,并且计算出其化学性质。基于这项策略,科学家们已经预测出了近5万种稳定的材料结构。不过在利用AI发现新材料时,一个障碍在于,如何提升学习算法适应与其学习相反的结果的能力。
在一项最新研究中,来自Google DeepMind的研究团队实现了突破。他们开发了被称为材料探索图像网络(Graph Networks for Materials Exploration, GNoME)的深度学习工具,GNoME能够通过大规模的主动学习,提高发现新材料的效率。
为此,GNoME首先利用已有文献与Materials Project等数据库进行训练,以生成潜在化合物的不同候选结构。其中,Materials Project是由美国劳伦斯伯克利国家实验室建立的开放存取数据库,用于计算已知、预测材料的特性,并为后续的技术应用提供有潜力的材料。随后,经过训练的GNoME在一系列后续尝试中改进对结构的预测,以寻找稳定的候选化合物。能够从错误的预测结果中学习,正是GNoME相较于以往的AI系统的重要优势。
基于这项策略,GNoME发现了超过220万个晶体结构,其中包括38万个添加至Materials Project的稳定结构。其中,GNoME对稳定结构的预测准确率提高到80%以上。这近40万个新型稳定化合物的晶体结构与稳定性信息,大幅提升了科学家可以利用的信息量。
当然,预测材料是一回事,但要在实验室里造出相应的材料是另一回事。在另一项研究中,加州大学伯克利分校领导的研究开发了一个自主实验室系统(autonomous-laboratory,简称A-Lab),可以快速、准确地合成目标化合物,将GNoME的预测结果转变为现实。
与GNoME一样,A-Lab也具备主动学习的能力。在利用已有的科学文献进行训练后,A-Lab可以通过主动学习进行进一步的调整,从而为预期的化合物创建多个初始合成配方。接下来,A-Lab可以利用机械臂进行实验,根据设计的反应物配方将粉末状固体原料混合、加热,并分析反应的产物。如果根据配方得到的产物纯度不足50%,A-Lab可以调整配方以继续实验,直至达成目标或是所有可能的候选配方被用尽。
可以看到,A-Lab的整个实验流程无需人类干预,其能够自行设计出合成产物所需的配方,自己做实验,分析、解释实验数据,并自行决定如何改进后续实验。
而A-Lab的实验结果也相当炸裂。在17天的连续实验中,A-Lab开展了355次实验,合成了58种目标化合物中的41种,其中9种是在主动学习改进了合成过程后,才得以实现。A-Lab的合成成功率达到71%,相当于每天成功合成超过两种材料。作为对比,人类研究人员可能需要几个月的猜想与实验过程,才能创造出一种新材料,更不用说还有很多实验最终无功而返。
作者还指出,71%的合成成功率还不是终点:微调算法后,成功率可提升至74%;如果计算技术得到相应的改善,成功率还能进一步提升至78%。
▲A-Lab的全自动实验流程(图片来源:参考资料[2])
领导这项研究的Gerd Ceder教授说:“我们已经证明,将理论、数据与自动化相结合,会生成令人难以置信的结果。我们可以比以往任何时候都更快地制造、测试材料,向Materials Project添加更多数据,这意味着我们可以作出更明智的选择。“
从预测到生产,这两项研究展示了一条无机化合物生产的全新路径,这些全新的材料在碳捕捉、光催化剂、热电材料、太阳能电池的透明导体材料等等场景中有着广阔的应用潜力。正如Ceder教授所言:“这些进展将改变世界——不是A-Lab本身,而是其产生的知识与信息。”