DAOrayaki |机器学习与量子复杂性

DAOrayaki |机器学习与量子复杂性

DAOrayaki DAO研究奖金池:

资助地址:  DAOrayaki.eth

投票进展:DAO Reviewer  1/0 通 过

赏金总量:60 USD

研究种类:Quantum Computing, Quantum Complexity, Machine Learning

原文作者:   Charlie Wood

创作者:hahaho@DAOrayaki.org

审核者:Yofu@DAOrayaki.org

原文:  Quantum Complexity Tamed by Machine Learning

如若科学家们能了解电子在分子中的作用,他们将能预测实验药物和高温超导体的一切可能变化。基础物理学已有数十年的发展,通过人工智能将迈上一个新的台阶。

2018年,气候模拟是美国超级计算集群(目前全球领先)计算周期的第三大用途,夸克和其他亚原子粒子的研究排在第二位。位居榜首的是物理领域中被引用次数最多的想法(尽管很少有人听说过)。

加州大学欧文分校的理论化学家Kieron Burke评价到:“它很重要,它是科学中最重要的事情之一。”

这一想法就是密度泛函理论 (DFT),它是物理学家和化学家用来理解比氢原子更复杂的事物的主要方法。几十年来,研究人员利用DFT来预测从咖啡的味道到木星核心的稠度等一切事物。

DFT为科学家们提供了一种强大的捷径,可以预测电子的去向,进而预测原子、分子和其他被电子包裹的物体将如何行动。物理学家和化学家一直以来尝试利用深厚的专业知识来使他们的方程式(人脑推算)更好地揭示电子背后的奥秘。但最近,基于神经网络设计的新工具正飞速发展,一些研究人员认为,机器学习可以帮助研究人员朝着电子的奥秘快速前进,从而解开新药、超导和特殊材料的秘密。

石溪大学凝聚态物理学家Marivi Fernández-Serra说:“这些机器学习方法,它们在几年内就达到了非常高的水平。”

电子耳语者

了解电子就是了解它们构成的原子、分子和材料,从20世纪20年代欧文·薛定谔发表他的同名方程以来,物理学家已经对电子有了很深的理解。但在分析电子群时,这些理解又丧失了意义。

因为电子更像云而不是粒子,它们在空间中扩散,以多种方式与所有其他电子重叠和碰撞。随着数量的增加,使用薛定谔的波动方程来解释所有电子之间的恒定接触变得越来越困难。

加州大学伯克利分校(University of California, Berkeley)的凝聚态物理学家Jeffrey Neaton说:“就算是目前世界上最大的磁盘空间,把仅仅几个粒子的波函数写入其中也远不够。”

1964年,Pierre Hohenberg和Walter Kohn找到了解决方案,可以完美地了解电子的每一角度的信息,方法是将电子涂在一种人造流体中,这种液体有些地方较厚,有些地方较薄。这种电子能量的密度包含了分子复波函数的所有信息,这使物理学家摆脱了从前单独追踪电子的种种困境。

Hohenberg和Kohn的工作证明了一个强大的方程——宇宙密度泛函的存在。该方程以电子汤(electron soup)为例,计算其能量,引导物理学家找到电子最自然的排列方式(能量最低的排列方式)。从理论上讲,这个函数是通用的,因为它可以描述任何系统(从硅砖到水分子)。唯一的问题是,没有人知道这个方程是什么样子的。

不久,Kohn和另一位物理学家Lu Jeu Sham写下了一个实用的密度泛函。捕捉电子行为的所有细微方面的精确功能难度较高,所以他们将其一分为二。上半部分,它提供了一组只能平均感知彼此的电子的能量。后半部分,则是处理而来自拜占庭量子效应和非局域相互作用的过剩能量,这一部分也被称为敷衍因子。

在接下来的几十年里,科学家们以Kohn和Sham的工作为基础,用越来越聪明的方法来估计敷衍因子,密度泛函成为了理解电子的事实上的方法。研究人员使用它们来预测一个原子是如何获取或释放一个电子,分子振动的方式(好奇号探测器用来寻找火星生命迹象的信息),晶格的原子排列,材料中的声速等等。这一理论源源不断的应用使Kohn赢得了1998年的诺贝尔奖。

功能阶梯

要求DFT提供足够高的精度,与我们对敷衍因子的一无所知想矛盾,因此目前只能锐化草图的细节以使其更符合通用密度泛函。

人工智能公司DeepMind的理论化学家Aron Cohen就是寻找神秘的通用方程的人之一。为了扎根于理论量子化学的抽象理论,他手边放着一个蓝色的3D打印玩具。它看起来像一个塑料幸运饼干,它的曲线描绘出了一个通用函数的确切形状,但只适用于最简单的系统:它可以用来揭示关于两个原子共享的两个电子的信息。不过,这提醒他,可能存在一种可以处理任意数量电子和原子的函数。“

DFT研究的一个主要目标是找到通用泛函的更精确的近似值。坦普尔大学(Temple University)的物理学家John Perdew长期以来一直带头开展这项工作。他将通往通用功能的道路描述为攀登梯子上的阶梯。在每个梯级上,物理学家都会添加新的成分,最简单的成分就是每个位置的电子混合物的厚度,在下一个梯级,需要考虑厚度在不同地方的变化速度,给研究人员一个更广阔的视野,使功能更精确。

Perdew策略的一个关键部分是使用物理手段来确定近似值所必须遵守的数学属性,即所谓的“精确约束”。等级越高,满足这些约束条件的就越多,研究人员就需要更加努力地寻找符合所有这些约束条件的方程。

Perdew的团队于1999年开始研究混合六种成分的第三级泛函,并在2015年发布了一种名为SCAN的的泛函。这是他的第八次尝试,也是第一次遵守与第三级相关的所有17个已知限制。SCAN适用于分子和固体,是迄今为止发现的最精确的通用泛函之一。

Perdew说:“第三层泛函有非常丰富的可能性,需要时间来弄清楚什么是重要的,什么是有效的。”

机器转向

当Perdew改进用物理手段改进密度泛函时,一场革命也正在酝酿中。机器算法能否弥补人类的不足?

2012年,伯克和他的合作者首次尝试将机器学习应用于一组简化的电子。2021年初取得了一项突破,当时Burke和合作者为一个玩具问题建立了一个神经网络,该网络用了一个极其罕见的方式跟踪密度误差和能量误差。卢森堡大学的理论化学家Alexandre Tkatchenko说:“要想既提供密度又提供能量,需要一个灵活的架构。” “用人类的思想写一个函数式的表格并不容易。”

Stony Brook的Fernández-Serra使用类似的策略设计了一个神经网络,该网络沿着Perdew的足迹研究一系列分子和能量,并寻找服从大多数已知约束的第三层泛函。

正如她和Sebastian Dick在2021年的《Physical Review B》中报道的那样,由此产生的敷衍因子在比SCAN高出大约10%。适度的增益也表明Perdew的工作已经接近于第三层的极限。

Fernández-Serra说。“在不使用机器学习的情况下,Perdew的功能真的是尽善尽美。而要想了解的更深入,需要更复杂的算法。

DeepMind扩展阶梯

而在“大革命”前不久,DeepMind的研究人员已经征服了围棋,他们正在寻找新的挑战。他们对科学领域机器学习问题特别感兴趣, Cohen向他们推荐了DFT,他花了数年时间研究简单系统的精确功能,比如他放在办公桌上的那个,但它们还远不足够。

DFT核心的一个弱点侵蚀了科恩:电流密度泛函通常会过多地涂抹电子。这个问题对于不平衡的系统尤其明显,电子应该主要聚集在一个分子上。DFT倾向于将电子汤更均匀地分布在两个分子上。一个相关的问题出现在化学反应中,当DFT为粒子合并和拉开提供不正确的能量时,即使对于像氢原子这样简单的情况也是如此。

为了设计下一代功能,Cohen和DeepMind团队选择不去操心长串的物理原理。他们会依赖数据,大量的数据。他们在文献中搜索了具有已知能量的数千个分子的数据库(使用薛定谔方程或类似方法以高成本计算)。然后进一步,使用超级计算机来计算数百个额外分子的能量——其中许多分子需要数天时间才能计算出来。

当组建完一个详尽的示例分子库时,Cohen和其他化学家决定了功能应该如何构建。

他们采用了一种诱人的多功能方法。经过多年的反复试验,研究人员发现了一种特殊的方法来估计部分敷衍因子。当一个函数的80%的能量以一种方式计算而20%以另一种方式计算时,性能出现了一个最佳点。长期以来,研究人员一直怀疑下一步将是让80/20比率在一个分子周围从一个点到另一个点发生变化,但没有人完全成功地做到这一点。

1998年引入这种函数的Burke说,“可能有100篇论文让人们使用这种形式,但他们还没有生产出每个人都可以使用的东西。也许这对个人力量来说太难了。”

凭借其大量的示例分子和DeepMind团队的机器学习专业知识,该团队的神经网络能够训练出这种类型的灵活的第四层泛函。它可以比SCAN和其他方式更好地估计各种分子的能量,主要是因为它更准确地放置电子并更好地描述它们的自旋。被称为DM21的泛函是第一个能够处理化学键断裂和形成的通用泛函。12月9日,该小组在Science中描述了他们的功能。

Burke表示:“这是第一个合理的通用功能,如果这东西像它看起来一样好,一年内就会有成千上万的人开始使用它。”

但是,Burke警告说,完全测试该功能需要时间。该领域到处都是功能残骸,这些残骸最初看起来很有希望,但隐藏了致命的缺陷,研究人员才刚刚开始分解DM21。

一个弱点是DM21训练了元素周期表前三行中的分子,其中数据更丰富。这意味着它学到的电子行为可能不会转移到金属原子或固体材料上,例如,这两者对于分析铜基高温超导体系列至关重要。目前,代表这些系统的通用泛函的细节仍然可以通过SCAN和其他泛函更好地近似。

“在可预见的未来,我认为不会有一种功能可以做到这一切,”Tkatchenko说。

迈向通用泛函

Fernández-Serra和DeepMind等新泛函的开发表明,机器学习可以成为探索通用密度泛函的有力工具,尤其是与分子和化学相关的领域。

Tkatchenko说,这有利于“真正调整你想要解决的化学空间部分并使其功能尽可能高效,我认为机器学习技术会继续发展。”

但是,改进的化学泛函是否会揭示与从原子到材料的所有事物相关的一般特征,还有待观察。例如,Perdew继续寻找能进一步改进功能的传统方式。“我可能不会在机器学习方面投入太多时间,”“因为虽然机器可以学习,但它们还不能向我们解释它们学到了什么。”

Cohen希望DM21已经看到了可能成为未来近似值的持久元素的特征,无论它们是由人类思维还是神经网络得来的。“函数是复杂的,所以对它进行任何攻击都是好的。”“理想情况下,我们希望将它们全部统一起来。”


通过 DAO,研究组织和媒体可以打破地域的限制,以社区的方式资助和生产内容。DAOrayaki将会通过DAO的形式,构建一个代表社区意志并由社区控制的功能齐全的去中心化媒体。欢迎通过文末方式提交与DAO、量子计算、星际移民、DA相关的内容,瓜分10000USDC赏金池!欢迎加入DAOrayaki社区,了解去中心化自治组织(DAO),探讨最新话题!

官方网站:https://daorayaki.org

Media:https://media.daorayaki.org

Discord server: https://discord.gg/wNUPmsGsa4

Medium: https://medium.com/@daorayaki

Email: daorayaki@dorafactory.org

Twitter: @daorayaki_

微信助手:DAOrayaki-Media

详情请参考:

Dora Factory支持去中心化DAO研究组织DAOrayaki

对DAOrayaki第一阶段的回顾--去中心化媒体的先驱

DAOrayaki |DAOrayaki 开启去中心化治理2.0时代

DAOrayaki |风险投资的范式转移:无限主义基金和无限游戏

DAOrayaki |DAOrayaki dGov 模型:基于Futarchy的正和游戏

更多关于DAO的文章,关注Dorafactory,查看往期文章。

Category:

DAOrayaki

DAOrayaki is a decentralized media and research organization that is autonomous by readers, researchers, and funders.