利用人工智能发现迄今为止类太阳恒星周围最近的最小系外行星

近日,由中国科学院上海天文台葛健教授带领的国际团队创新了一种结合GPU相位折叠和卷积神经网络的深度学习算法,并成功在开普勒(Kepler)2017年释放的恒星测光数据中发现了五颗直径小于地球、轨道周期短于1天的超短周期行星,其中四颗是迄今为止发现的距其主星最近的最小行星,类似火星大小。这是天文学家首次利用人工智能一次性完成搜寻疑似信号和识别真信号的任务,相关研究成果发表在国际天文学期刊《皇家天文学会月报》(MNRAS)上。

经过5年的努力和创新,研究团队成功开发了结合GPU相位折叠和卷积神经网络的深度学习的新算法(GPFC)。该算法比国际上流行的BLS法搜寻速度提高了约15倍,检测准确度和完备度各提高约7%,显著提高了凌星信号搜索速度、精度和完备度。该算法已成功应用在Kepler的数据集中,并识别出五颗新的超短周期行星:Kepler-158d、Kepler-963c、Kepler-879c、Kepler-1489c和Kepler-2003b。其中,Kepler-879c、Kepler-158d、Kepler-1489c和Kepler-963c分别位列迄今为止发现的最小超短周期行星中的第一、第二、第三和第五名。Kepler-879c、Kepler-158d、Kepler-1489c和Kepler-2003b是最接近其主星的小型行星,其轨道半径在5个恒星半径以内,展现了新的算法在搜寻微弱凌星信号的优势。

这些超短周期行星的存在为行星系统的早期演化、行星-行星相互作用以及恒星-行星相互作用的动力学(包括潮汐力和大气侵蚀)研究提供重要线索,对行星形成理论研究有重大意义。该研究成果对在高精度光度观测数据中快速、高效搜寻凌星信号提供了新的研究方式,也充分显现了人工智能在天文海量数据中探寻微弱信号的广泛应用潜力和前景。

图1:已知行星半径和行星轨道半长轴分布以及五个新发现的超短周期行星(红点)。四个新的超短周期行星——Kepler-158d、Kepler-879c、Kepler-1489c和Kepler-2003b——是最接近它们主星的最小行星之一,其轨道在5个恒星半径以内。

图2: 行星半径小于1.5倍地球半径与五个新发现的超短周期行星(红圈标记)及NASA系外行星档案中已确认系外行星的主星开普勒星等的关系图。标记颜色对应主星的有效温度。新发现的超短周期行星的主星是类太阳恒星(有效温度~5000-6000K)中最暗的目标,显示新的探测方法的超高灵敏度。

艺术想象图(制图:石琰)新发现的类似火星大小的超短周期系外行星。由于离主星非常近,行星不光表面温度很高,而且潮汐力会挤压行星内部和表面产生很多火山喷发。


论文链接:

https://academic.oup.com/mnras/article/534/3/1913/7762975

科学联系人:

葛健,中国科学院上海天文台,jge@shao.ac.cn, 手机号码:13764339667



背景参考材料

葛健表示:“本次工作的真正起始时间是2015年,当年的人工智能AlphaGo刚取得了重大突破,打败了围棋界的职业高手。我受佛罗里达大学计算机系同事李晓林教授的激励和启发,决定试图把人工智能的深度学习应用在Kepler释放的测光数据中,寻找Kepler使用传统方法没能找到的微弱凌星信号。幸运的是经过了近10年的努力,我们终于有了第一份收获,本次工作的突破性发现是人工智能在天文大数据领域应用的又一个里程碑,要想使用人工智能在海量的天文数据中‘挖’到极其稀少的新发现,就需要发展创新的人工智能算法,同时需要依据新发现现象的物理图像特征生成的大量的人工数据集做训练,使之能快速、准确、完备地探寻到这些很难在传统方式下找到的稀少而微弱的信号。”

普林斯顿大学天体物理学家Josh Winn教授评论:“超短周期行星,或称“熔岩世界”,是我最喜欢的系外行星类型之一。它们拥有极其极端和出乎意料的特性,为我们理解行星轨道如何随时间变化提供线索。我原以为开普勒数据中的凌星信号已经被“挖掘殆尽”,不会再有其他行星发现,听到这些新的潜在行星的消息让我非常兴奋,这项寻找新行星的技术成就让我印象深刻。”

自从超短周期系外行星于2011年在Kepler测光数据中首次被发现以来,这些新发现给行星形成理论带来了独特的机遇和挑战,促使科学家重新审视和完善现有的行星系统形成和演化模型。传统的基于太阳系的行星形成理论并未预测轨道比水星更接近的行星。

这些超短周期行星的存在为行星系统的早期演化、行星-行星相互作用以及恒星-行星相互作用的动力学(包括潮汐力和大气侵蚀)研究提供重要线索。超短周期行星很可能不是在其当前的位置形成的,而是从原始轨道向内迁移。这是因为这些超短周期行星的主星在其前期形成阶段的半径比现在大得多,距离更近的超短周期行星如果在恒星形成阶段就在恒星附近,很可能早已被其主星吞噬。同时鉴于经常观察到超短周期行星伴有较长周期轨道的外部行星,因此推测超短周期行星的起源涉及行星兄弟姐妹之间的相互作用,这些相互作用将超短周期行星重新定位到它们当前靠近主星的轨道上,可能是以前由恒星自身占据的轨道。除此之外,超短周期行星的这种轨道迁移也有可能是由与原行星盘的相互作用或通过与主星的潮汐相互作用驱动而形成的。

超短周期行星在类太阳恒星的发生率很低,只有大约0.5%,通常半径小于2倍地球半径,或在超热木星的情况下,大于10倍地球半径。到目前为止,总共只找到了145颗超短周期行星,其中只有30颗半径小于地球半径。理解超短周期行星的相对丰度及其特性对于检验理论模型至关重要。然而,已知的超短周期行星样本量太小,它们的统计特征和出现率很难精确了解。

葛健团队设计的在GPU上并行化的快速折叠算法可以提高低信噪比的凌星信号,从而实现高精度快速搜索。该卷积神经网络架构由19层神经网络组成。由于已知的凌星信号真实样本太少,没法有效、精确训练神经网络。研究团队根据凌星信号图像的物理特征创新地设计和生成各种可能的凌星信号,然后加入200万个利用Kepler真实光变数据人工合成的光变曲线上进行训练。训练后的神经网络再应用在Kepler的数据集中并和GPU快速折叠算法一起使用搜寻数据中的超短周期凌星信号。这种GPFC新算法比国际上流行的先进的BLS法搜寻速度提高了约15倍,检测准确度和完备度各提高约7%。这些性能的提高帮助团队发现了这5颗半径很小的超短周期行星。这些火星大小的行星提供了更加多样化的系外行星样本,为理解超短周期行星形成机制提供新线索。



附件下载: