AI for Science研究范式新成果DPA-1发布为新工业打造AI应用基础设施

近日，AI for Science领域最大的开源社区DeepModeling举办了2022年社区年会。会上，北京科学智能研究院（AI for Science Institute,Beijing）联合深势科技，发布了首个覆盖元素周期表近70种元素的深度势能原子间势函数预训练模型—— DPA-1。该成果由北京科学智能研究院、深势科技、北京应用物理与计算数学研究所共同研发。

DPA-1被誉为自然科学界的GPT。2020年，DPA-1雏形曾与预训练语言模型GPT-3共同入选了世界人工智能十大重要成果。DPA-1可模拟原子规模高至100亿，目前已经在高性能合金、半导体材料设计等应用场景中证明了其领先性和优越性。这一突破也是AI for Science走向大规模工程化的重要里程碑。

早在2020年，北京科学智能研究院与深势科技团队通过将机器学习与高性能计算相结合，实现了1亿原子第一性原理精度的分子动力学模拟，获当年全球高性能计算领域最高奖项“戈登·贝尔”奖。此次发布的 DPA-1，在原有基础上进一步优化高性能算法，将模拟上限提升至100亿原子数量级。

研究人员还通过可视化模型元素信息，发现其在空间呈螺旋状分布，并且巧妙地和元素周期表中位置一一对应，元素周期表中同周期元素沿着螺旋下降方向排列，而垂直螺旋方向则对应着同一主族元素分布，这也证明了此预训练模型具有良好的可解释性。

对于从事材料设计研究的科研人员，可基于DPA-1快速构建高精度、方便易用的原子间势函数模型，利用人工智能技术进行分子模拟，设计创新材料，洞见研究方向，减少不必要的实验，大幅度缩短研发周期，降低研发成本。

近些年来，随着科学界对AI for Science 研究范式的认可和实践，微观科学计算领域实现了大量的数据积累和模型探索，这为领域预训练模型构建提供了诞生基础。DPA-1利用注意力机制等构造，大幅提高了模型迁移能力和元素容量，使用少量数据即可获得高精度模型，显著减少建模开销。就像Bert的出现彻底改变了自然语言处理领域，这一预训练大模型的诞生意味着势能函数的生产也真正进入“预训练+少量数据微调”的新范式。

据悉，此成果已经贡献在 DeepModeling 开源社区，并在科学智能广场正式公开。北京科学智能研究院与深势科技希望基于此和全球各界人士推动建立更加开源开放的科研生态，加速领域内原始创新的速度。