您现在的位置是: 首页 > 创业创新 >

粒子物理学家与AI合作解决最棘手的科学问题

  • 2020-02-26 16:15:32    来源:   作者:

欧洲粒子物理实验室CERN的全球最大粒子加速器大型强子对撞机(LHC)的实验每秒产生大约一百万千兆字节的数据。即使经过缩减和压缩,在短短一个小时内累积的数据也与Facebook全年收集的数据量相似–太多了,无法存储和分析。

幸运的是,粒子物理学家不必自己处理所有这些数据。他们与一种称为机器学习的人工智能形式合作,这种学习形式本身可以学习如何进行复杂的分析。

粒子物理学家与AI合作解决最棘手的科学问题

一组研究人员,包括能源部SLAC国家加速器实验室和费米国家加速器实验室的科学家,在今天发表在《自然》上的一篇论文中总结了机器学习在粒子物理学中的当前应用和未来前景。

“与我们设计用来进行特定分析的传统计算机算法相比,我们设计了一种机器学习算法,可以自行解决如何进行各种分析,从而为我们节省了无数的设计和分析工作时间,”合著者亚历山大说。来自威廉与玛丽学院的Radovic,从事NOvA 中微子实验。

筛选大数据

为了处理大型实验(如大型强子对撞机)中产生的巨大数据量,研究人员应用了他们所谓的“触发器”(triggers)-专用硬件和软件,这些硬件和软件可以实时决定要保留哪些数据进行分析,以及丢弃哪些数据。

麻省理工学院(Massachusetts Institute of Technology)的LHCb科学家Mike Williams说,在LHCb中,这项实验可以揭示为什么宇宙中的物质比反物质多得多的原因,机器学习算法至少做出了这些决定的70%。 《自然》摘要的作者。他说:“机器学习在实验的几乎所有数据方面都发挥着作用,从触发器到剩余数据的分析。”

事实证明,机器学习在分析领域极为成功。大型强子对撞机上巨大的ATLAS和CMS检测器使人们能够发现希格斯玻色子,每个检测器都有数百万个传感元件,需要将其信号放在一起以获得有意义的结果。

粒子物理学家与AI合作解决最棘手的科学问题

“这些信号构成了一个复杂的数据空间,”来自SLAC的Michael Kagan说,他是ATLAS的作者,也是《自然》杂志的作者。“我们需要了解它们之间的关系才能得出结论,例如,探测器中的某个粒子轨道是由电子,光子或其他物质产生的。”

中微子实验也受益于机器学习。由费米实验室管理的NOvA研究中微子在穿越地球时如何从一种类型转变为另一种类型。这些中微子的振荡可能会揭示出一种新的中微子类型的存在,某些理论认为这是一种暗物质的粒子。NOvA的探测器正在监视中微子撞击探测器材料时产生的带电粒子,然后机器学习算法对其进行识别。

从机器学习到深度学习

机器学习的最新发展(通常称为“深度学习”)有望进一步推动粒子物理的应用。深度学习通常是指使用神经网络:计算机算法的结构受人脑中密集的神经元网络的启发。

这些神经网络在训练期间会自己学习如何执行某些分析任务,在训练期间会向他们显示示例数据(例如模拟),并告诉他们执行情况如何。

SLAC的合著者Kazuhiro Terao说,直到最近,神经网络的成功还很有限,因为对其进行训练非常困难。他是从事MicroBooNE中微子实验的SLAC研究员,该研究将中微子振荡作为费米实验室短基线中微子程序的一部分,将成为长基线中微子设施(LBNF)未来深层地下中微子实验(DUNE)的组成部分。他说:“这些困难将我们限制在只有两层深度的神经网络上。” “由于算法和计算硬件的进步,我们现在更好地了解了如何构建和训练更强大的网络,深度达数百或数千层。”

深度学习的许多进步是由技术巨头的商业应用以及他们在过去二十年中产生的数据爆炸所驱动的。Radovic说:“例如,NOvA使用受GoogleNet架构启发的神经网络。” “它以其他方式只能通过多收集30%的数据来实现,从而改善了实验。”

创新的沃土

机器学习算法日趋复杂和微调,为解决粒子物理问题提供了前所未有的机会。

卡根说,他们可以使用的许多新任务与计算机视觉有关。“这类似于面部识别,只是在粒子物理学中,图像特征比耳朵和鼻子更抽象。”

诸如NOvA和MicroBooNE之类的一些实验产生的数据可以轻松转换为实际图像,而AI可以很容易地用于识别其中的特征。另一方面,在大型强子对撞机实验中,首先需要从由数百万个传感器元件生成的模糊数据池中重建图像。

“但是,即使数据看起来不像图像,如果我们能够以正确的方式处理数据,我们仍然可以使用计算机视觉方法,” Radovic说。

粒子物理学家与AI合作解决最棘手的科学问题

这种方法可能非常有用的一个领域是分析大型强子对撞机大量产生的粒子流。喷头是窄颗粒的喷雾,其单个轨迹很难分离。计算机视觉技术可以帮助识别喷气机中的特征。

深度学习的另一个新兴应用是粒子物理数据的模拟,该数据可预测例如大型强子对撞机在粒子碰撞中发生的情况,并可与实际数据进行比较。此类仿真通常很慢,并且需要巨大的计算能力。另一方面,人工智能可以更快地进行仿真,从而有可能补充传统方法。

卡根说:“仅仅几年前,还没有人想到可以训练深度神经网络来“随机化”来自随机噪声的数据。” “尽管这是非常早期的工作,但它显示了很大的希望,并可能有助于应对未来的数据挑战。”

尽管取得了所有明显的进步,但是机器学习爱好者经常会受到合作伙伴的怀疑,部分原因是机器学习算法大多像“黑匣子”一样工作,几乎无法提供有关如何得出特定结论的信息。

威廉姆斯说:“怀疑主义非常健康。” “如果像LHCb中那样,使用机器学习来丢弃数据的触发器,那么您将非常谨慎并设置很高的标准。”

因此,建立粒子物理学中的机器学习需要不断地努力,以更好地了解算法的内部工作原理,并在可能的情况下对真实数据进行交叉检查。Terao说:“我们应该始终试图理解计算机算法的作用,并始终评估其结果。” “不仅对机器学习,对所有算法都是如此。因此,持怀疑态度并不能阻止进步。”

快速的进步使一些研究人员梦想着在不久的将来可能实现的目标。“今天,我们主要使用机器学习来查找数据中的特征,这些特征可以帮助我们回答一些问题,” Terao说。“从现在开始的十年中,机器学习算法也许能够独立地提出自己的问题,并能够在发现新的物理原理时加以识别。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
Top