印度科学研究所(IISc)在一份声明中指出,缺乏材料性质的数据是一个障碍。这些数据对于训练能够预测具有特定性质(如电子能带隙、形成能量和机械性能)的材料的模型至关重要。目前,获取这些数据的方法既昂贵又耗时。
研究人员在印度科学研究所(IISc)与伦敦大学学院的合作下,开发了基于机器学习的方法,以有限的数据预测材料属性。
这项研究显示,这种方法可以辅助发现半导体。
它还可以预测电池电极内离子移动的速度,帮助构建更好的储能设备。
IISc的研究团队,在Sai Gautam Gopalakrishnan助理教授的带领下,开发了一个基于图神经网络(GNNs)的模型来进行这项研究。
IISc在一份声明中解释说,缺乏材料属性的数据——这是训练能够预测材料具有特定属性(如电子带隙、形成能量和机械性能)的模型所需的数据——是一个障碍。
这是因为目前使用的昂贵且耗时的方法所致。
在迁移学习中,研究人员首先使用一个大型模型,在大规模数据集上进行预训练,然后微调以适应较小的目标数据集。
“在这个方法中,模型首先学会执行一个简单的任务,比如将图像分类为猫和非猫,然后针对特定任务进行训练,比如将组织图像分类为含有肿瘤和不含肿瘤的图像以进行癌症诊断。
”Gopalakrishnan解释道。
IISc科学家指出:“图神经网络的架构,如层数及其连接方式,决定了模型能够学习和识别数据中复杂特征的能力。
”
IISc团队发现,他们的基于迁移学习的模型,在预训练后再微调后表现远优于从头开始训练的模型。
研究团队还使用了一个名为多属性预训练(MPT)的框架,在这个框架中,他们同时在一个包含七种不同体三维材料属性的数据集上对模型进行预训练。
“该模型还能够预测它未经过训练的2D材料的带隙值。
”该研究所补充道。
Reshma Devi是材料工程系的第一作者和博士生,她表示:“团队首先确定了预测材料属性所需的训练数据量,并通过调整某些层同时冻结其他层来预训练模型。
”她补充说,研究人员提供了有关材料属性的数据输入(如介电常数和形成能量),使模型能够预测特定材料属性(如压电系数)的值。
Gopalakrishnan认为,图神经网络模型可以通过预测半导体形成点缺陷的趋势来帮助制造更好的半导体,并推动印度向半导体制造迈进。