MatterGen-加速材料发现
MatterGen是微软研究院科学智能中心提出的一种创新的生成式AI材料设计工具,它的出现为材料科学的逆向设计开启了全新篇章。
模型架构与创新设计
-
定制化的扩散过程:针对晶体材料的特殊性,引入定制化扩散过程。可独立对原子类型、坐标和晶格进行扰动,将其导向符合物理规律的随机分布。对原子坐标扰动时考虑周期边界条件,缩放噪声大小消除晶胞尺寸影响;对原子类型采用掩码方法,使其向“未确定”状态扩散以生成新结构类型;对晶格采用对称形式扩散,使其趋向具有平均原子密度的立方晶格。
-
等变性评分网络:训练等变性评分网络,输出原子类型、坐标和晶格的等变分数,代表每个原子和晶格参数与理想晶体结构的偏差,指导模型调整参数,减少结构噪声,生成更稳定晶体结构,无需直接从数据中学习对称性,提高了模型效率和泛化能力。
-
自适应模块与微调:引入自适应模块,插入基础模型各层,根据给定性质标签调整模型输出。采用分类器自由引导方法,引导生成过程朝向特定目标性质。微调策略能提升模型表现,且在标记数据量有限时高效工作,适应材料科学领域性质计算成本高昂的特点。
-
大规模数据集训练:基于大规模、高质量的训练数据集Alex - MP - 20进行训练,包含来自Mater