以 PINN 为基础,我们开发了一个框架,用于在不同震源位置和速度模型下进行地震建模。本研究的显著贡献包括:
1. 为了提高网络对不同速度模型的泛化能力,必须将速度变量 vp 作为系统的输入参数。本研究从监督学习中汲取灵感,训练过程包含两个连续步骤:速度编码波场预测器和物理引导的地震建模。在第一部分,我们将使用有限差分法(FDM)计算的不同速度模型对应的波场纳入训练数据集。随后,神经网络以速度模型为输入,生成特定速度模型的初始波场,作为后续步骤的初始条件。我们的主要目标是在不同的速度模型和相应的波场之间建立映射关系。与传统的数据驱动方法不同,我们只使用有限的训练数据。在物理引导阶段,PINN 被用来预测与第一步相同的预定速度模型的波场解决方案。PINN 遵循波方程和初始条件的约束,计算不同时间步长的波场。速度编码波场预测器为第二步中 PINN 参数的初始化提供了更可靠的基础,增强了改进后 PINN 的通用性;
2. 针对直接将 vp 作为网络输入的问题,本研究确定并深入探讨了其实际应用中固有的挑战。值得注意的是,在非均质介质中进行的模拟容易受到界面不连续性的影响,从而对网络预测的准确性产生重大影响。在 PINN 框架的基础上,我们引入了一种称为速度编码 PINN(VE-PINN)的新方法。这项研究通过在每一层中加入界面深度和速度等特征参数来区分各种速度模型。在标为 "速度编码波场预测器 "的初始步骤中引入这些特征参数作为输入,增强了网络捕捉速度变化和相应波场特征的能力;
3. 这种方法只需将声源位置作为输入,就能直接模拟不同声源位置的时域波场。神经网络以善于捕捉连续参数及其相应解之间的非线性关系而著称,因此这种方法特别有效。这种策略的基本功效源于其基本原理,即利用连续参数来表示本身具有不连续性的信息。这项研究简化了各种速度模型和波源位置的波方程建模工作流程。一旦网络的速度编码部分得到训练,就无需针对不同模型使用传统数值方法重新计算初始解。使用 PINN 进行多震源地震波模拟在频域取得了显著成功。然而,其在时域建模中的功效仍面临挑战。在时域模拟应用中,我们建议采用网络预测较窄时间范围内不同震源位置的初始解,作为整个时域物理引导训练的初始条件。利用初始部分的输出作为初始条件,VE-PINN 可以精确模拟地震波的传播。
为了对多种速度模型进行地震波建模,我们建议将速度模型 vp 作为神经网络的输入。将不同的速度模型及其相应的波场作为初始条件,目的是让神经网络熟练地学习与新速度模型相关的波场。然而,我们发现该网络难以有效捕捉突变,尤其是与地表不连续性相关的突变。此外,如图 6 所示,由于速度的离散性,网络的训练具有挑战性。在前面讨论的基础上,我们为每一层引入了界面深度和速度等参数,以表示不同的速度模型。这些参数在本文中称为特征参数,在特定范围内呈现连续变化,没有明显的中断。通过直接将界面位置作为网络的输入,界面不连续性带来的挑战得以缓解。
另一方面,将特征参数作为 PINN 的输入时,计算复杂度和成本会大幅增加。在这种情况下,神经网络需要理解不同特征参数的波场。因此,必须预测特定模型的波传播。因此,我们引入了一种新颖的分解训练方法,旨在减少 PINN 的输入维度并增强其训练稳定性。工作流程如图 2 所示,具体细节说明如下:
(1) 速度编码波场预测器: 如前所述,PINN 只求解特定速度模型的波方程。这意味着需要针对不同的速度模型和波源位置反复进行数值模拟。受监督学习的启发,我们使用了训练数据有限的速度编码方法。首先,使用有限差分法计算不同速度模型的数值波场 Ufdm。我们使用特征参数(d, vup, vlow)来表示随机的两层模型,其中 d 代表层界面深度,(vup, vlow) 分别表示顶层和底层的速度。然后,在整个域(x、z、t、d、vup、vlow、Ufdm)中随机采样这些波场的子集,形成训练数据集 D。随后,选择三个不同时间步长的波场作为 VE-PINN 第二阶段的初始条件。训练完成后,神经网络 1 无需重新训练即可推断出变速模型的波场。损失函数定义如下:
(2) 物理指导下的地震建模: 我们的研究表明,训练 PINN 的关键在于强化与初始条件相关的约束,因为这直接影响预测精度。在这一阶段,我们引入使用 NN1 生成的三个时间间隔的波场,作为针对特定速度模型进行进一步地震模拟的初始条件。通过加入与初始条件和 PDE 相关的约束条件,PINN 可以计算出具有合理精度的解。值得注意的是,对于各种速度模型,无需通过传统数值方法重新计算相应的初始波场。为了减轻高维问题带来的计算复杂性,我们选择不将特征参数作为输入。因此,损失函数定义如下:
1) 各种两层模型的地震建模:首先,我们演示了震源深度为 0.2 千米的两层速度模型的性能。特征参数包括界面深度 d∈[0.2, 1 km]和上下两层的速度,分别表示为 vup, vlow∈[0.6, 2 km/s]。我们在(d, vup, vlow)范围内随机选取 12 个样本,代表 12 个速度模型,计算 12 个速度模型的数值波场 Ufdm,并在域(x, z, t, d, vup, vlow,Ufdm)内随机选取 15,000 个点作为训练数据。神经网络 1 经过 30,000 次历时后,输出为图 5 中速度模型在 t = 0.1 秒、0.2 秒、0.4 秒时的波场 Uθ1(不包括在训练集中)。网络 1 的训练随即停止。在 "物理引导的地震建模 "阶段,我们以 Uθ1 为初始条件,对神经网络 2 进行 60,000 次历元训练。PINN 可以预测 t = 0 - 1 s 内的波场,结果如图 5 所示。第一行显示的是 VE-PINN 解决方案,第二行显示的是来自 FDM 的数值波场。两行都描述了波随时间的传播,显示了 VE-PINN 解决方案与参考方案之间的精确一致。通过对速度模型进行网络 1 条件化,VE-PINN 可以有效地模拟原始数据集中未包含的模型的波场。
为了说明 VE-PINN 的有效性,我们将其性能与传统 PINN 进行了比较。以图 5 中的模型(b)为例,其顶层和底层的速度分别为 1.0 km/s 和 1.2 km/s,界面深度为 0.5 km。利用 PINN,我们将特征参数作为输入(情况 1),将整个速度模型 vp 作为输入(情况 2)。情况 1 和情况 2 的网络训练初始条件与 VE-PINN 相同,包括 12 个速度模型及其相应的波场。图 6 比较了情况 1、情况 2 和 VEPINN(情况 3)。计算时间和误差记录见表 1。从结果中可以明显看出,本研究讨论的 VEPINN 具有显著的优势,只需较少的时间就能达到较高的精度。此外,它在捕捉界面波场变化方面的能力也有所增强。
图 8:本文使用的三层模型。本文使用的三层模型。考虑到地质条件,一般认为在大多数情况下,深层的速度超过浅层的速度。假设沉积岩的速度范围为 1.5 km/s-6.0 km/s,我们设置了一个三层水平模型。各层厚度和速度的具体情况如图 8 所示。
我们设置的速度模型如图 8 所示,感兴趣域的范围为 x、z∈[0,2 km],t∈[0,1.2 s]。特征参数包括界面深度 (d1, d2) ∈ [0, 2 km](其中 d1 < d2),以及顶层、中层和底层的速度 vup、vlow、vmid 分别∈ [0.3, 3 km/s]。我们在域中随机选择 14 个采样点(d1, d2, vup, vlow, vmid),对应 14 个速度模型。我们使用 FDM 计算数值波场 Ufdm,并在域中随机采样 30,000 个点(x, z, t, d1, d2, vup, vlow, vmid,Ufdm)作为训练数据。神经网络 1 训练 30,000 次后,图 8 中的速度模型在 t = 0.1 秒、0.2 秒、0.5 秒时产生波场 Uθ1(训练集中未使用),随后停止网络 1 的训练。在 "物理引导的地震建模 "阶段,以 Uθ1 为初始条件,对神经网络 2 进行 60,000 次历元训练。PINN 可以预测 t = 0 - 1.2 s 内的波场,结果如图 9 所示,第一行和第二行分别为 VE-PINN 和数值建模预测的波场。我们观察到,预测解与参考解之间的误差相对较小。将界面深度直接编码到神经网络输入中可以更快地捕捉到每一层内的速度变化。VE-PINN 具有模拟波现象的能力,包括在各种界面上产生的反射波和透射波。
所提出的方法适用于三层或三层以上的模型,只需修改特征参数即可。考虑到地质情况,一般认为在大多数条件下,深层的速度超过浅层的速度。假设沉积岩的速度范围在 1.5 km/s-6.0 km/s 之间,我们设置了一个三层水平模型。各层厚度和速度的具体情况如图 8 所示。
我们设置的速度模型如图 8 所示,感兴趣域的范围为 x、z∈[0,2 km],t∈[0,1.2 s]。特征参数包括界面深度 (d1, d2) ∈ [0, 2 km](其中 d1 < d2),以及顶层、中层和底层的速度 vup、vlow、vmid 分别∈ [0.3, 3 km/s]。我们在域中随机选择 14 个采样点(d1, d2, vup, vlow, vmid),对应 14 个速度模型。我们使用 FDM 计算数值波场 Ufdm,并在域中随机采样 30,000 个点(x, z, t, d1, d2, vup, vlow, vmid,Ufdm)作为训练数据。神经网络 1 训练 30,000 次后,图 8 中的速度模型在 t = 0.1 秒、0.2 秒、0.5 秒时产生波场 Uθ1(训练集中未使用),随后停止网络 1 的训练。在 "物理引导的地震建模 "阶段,以 Uθ1 为初始条件,对神经网络 2 进行 60,000 次历元训练。PINN 可以预测 t = 0 - 1.2 s 内的波场,结果如图 9 所示,第一行和第二行分别为 VE-PINN 和数值建模预测的波场。我们观察到,预测解与参考解之间的误差相对较小。将界面深度直接编码到神经网络输入中可以更快地捕捉到每一层内的速度变化。VE-PINN 具有模拟波现象的能力,包括在各种界面上产生的反射波和透射波。