电子科技网站,深圳最大的广告公司,网站备案提交资料,建筑工程网签备案合同标题#xff1a;Adaptive Feedback Convolutional-Neural-Network-Based High-Resolution Reflection-Waveform Inversion 全波形反演#xff08;FWI#xff09;是一种非线性拟合观测地震记录从而获得高清晰速度模型的最优化算法。FWI能够通过拟合浅层初至波和反射波获得较准…标题Adaptive Feedback Convolutional-Neural-Network-Based High-Resolution Reflection-Waveform Inversion 全波形反演FWI是一种非线性拟合观测地震记录从而获得高清晰速度模型的最优化算法。FWI能够通过拟合浅层初至波和反射波获得较准确的浅层速度模型并通过拟合观测到的反射波数据来更新界面。但是FWI通常无法通过拟合深层反射波获得较准确的深层速度模型包括背景速度和反射界面信息因为模型梯度中的反射界面信息偏移成分比背景速度信息层析成像成分更加显著。因此FWI主要更新深层反射界面而不是深层背景速度而背景速度的误差会降低反射界面准确性。因此FWI很难为地震资料解释和油气储藏分析提供准确的深层速度模型。 随着深度学习在计算机视觉等领域获得重大突破利用深度学习预测速度模型包括浅层和深层背景速度以及界面信息成为了地震参数反演领域的研究热点之一。当有代表性的速度模型库可供深度学习训练和验证时深度学习可以有效基于先验信息比如观测地震记录或偏移图像预测真实速度模型。然而目前地震勘探领域并没有能够广泛代表各种不同构造的速度模型库。 中国科学院地质与地球物理研究所油气资源研究院重点实验室吴毓朗博士后与合作导师王彦飞研究员以及美国得克萨斯大学达拉斯分校George A. McMechan教授展开合作提出一种自适应反馈机制下基于卷积神经网络CNN的高清晰反射波反演算法CNN-RWI反复应用迭代更新的卷积神经网络CNN从平滑的初始速度模型层析成像分量和高分辨率偏移图像偏移分量预测真实速度模型。该算法既不需要拟合地震记录也不依赖广泛代表各种不同构造的速度模型库而是通过自适应地聚类切割先验速度模型构建训练样本利用不断改进的CNN准确预测高清晰速度模型包括浅层和深层的背景速度以及反射界面信息。CNN由更具代表性的训练数据集迭代更新该训练数据集是通过所提出的空间约束分裂分层k-means分组方法从最新的CNN预测速度模型中获得的。训练速度模型越有代表性CNN预测的速度模型就越准确。使用Marmousi 2 P波速度模型的不同部分的合成实例表明CNN-RWI反演速度模型的较浅和较深部分比共轭梯度FWICG-FWI更准确。CNN-RWI和CG-FWI都对起始速度模型的准确性和未知真实速度模型的复杂性敏感。 本文提出利用卷积神经网络CNN从通过地震数据预处理即先前的初始速度模型和相应的偏移图像。为了克服缺乏代表性速度模型作为训练标签实现自适应反馈机制以从最新获得的先验速度模型在第一次迭代时的较不准确的先验开始速度模型和在随后的迭代时的逐渐更准确的CNN预测的速度模型迭代地构建越来越多的代表性训练速度模型。我们还建议迭代地和自适应地将最新获得的先验速度模型划分为许多块特征以获得其相对较低维的随机扰动来构建训练速度模型。合成实例表明提出的基于CNN的反射波形反演CNN-RWI与传统的共轭梯度全波形反演CG-FWI一样基于相同的先验起始速度模型来估计速度模型但CNN-RWI对速度模型的反演精度高于CG-FWI。
一、Introduction—介绍 全波形反演FWI是一种强大的算法用于执行最小二乘非线性数据拟合优化以估计高分辨率速度模型。通过对源波场和剩余波场进行零滞后互相关而获得的常规FWI梯度可以分为三个分量a从直达波、折射波和潜水波获得的低波数分量b与反射相关联的低波数层析成像分量以及c与反射相关联的高波数偏移分量。由于直达波、折射波和潜水波相对于反射波的穿透深度较浅并且由于它们在源波场和剩余波场中的波径重叠如果走时误差在半个周期内Virieux Operto2009年梯度的这一分量可以有效地主要更新较浅的背景速度模型。由于初始模型通常是光滑的在FWI的第一次迭代中梯度主要由震源波场与界面处反射主导的剩余波场的相互作用给出。因此在第一次迭代中反射波主要提供界面处FWI梯度的高波数分量偏移分量。在下面的迭代中源和反射相关的剩余波场在界面处创建相应的散射波。然后从反射波获得FWI梯度的低波数层析分量因为源和反射相关的剩余波场的波径与在界面处散射的波重叠。界面处的反射相关的高波数迁移分量通常比界面上方的反射相关的低波数层析成像分量高一个数量级。因此在平滑的起始速度模型下常规FWI主要通过拟合观测到的反射数据来更新更深的界面而不是更深的背景速度模型。 为了有效地通过层析分量更新背景速度模型主要有三种类型的反射波形反演RWI被提出来保留层析分量但从梯度中去除偏移分量。第一种策略是基于入射波场和反射波场分别向下和向上传播的假设来分离上行波场和下行波场Chi等人2017; Fei等人2015; Hu和McMechan1987; Lian等人2018年; Liu等人2011; Wang等人2013年。然而如果一个层具有较大的倾角偏移分量不能被完全去除因此它导致背景速度模型在错误的方向上被更新。为了分离垂直和水平方向上的入射波场和反射波场Barbor和Warner2016提出使用一对1D双向波动方程来分别模拟垂直和水平波传播。第二种策略是应用散射角滤波基于层析成像分量对应于接近180°的散射角的假设Alkhalifah2014; Khalil等人2014; Wu Alkhalifah20152017; Yao等人2018年2019年。第三种策略是应用Born建模来分离层析成像和偏移分量Sun等人2017; Wu Alkhalifah2017; Xu等人2012; Yao Wu2017。Ma等人2012提出利用图像引导插值及其伴随算子从偏移图像获得稀疏模型并将反演约束为从稀疏模型插值的块状模型。Wang等人2021年提出了一种基于广义内部多次成像的RWIGIMI-RWI将数据残差与为每个源-接收器对存储的反射核进行卷积以更新层析成像速度。因此GIMI-RWI避免了Born模型的反偏移也是源独立的更新速度沿着波路径。我们参考Yao等人2020对RWI的概述。 卷积神经网络CNN首先在计算机视觉领域中被开发用于图像分类福岛 Miyake1982; Krizhevsky等人2012; LeCun等人1989年、1990年、1998年。CNN在计算机视觉中的成功部分归功于许多开放访问的大型数据集例如ImageNet数据集Deng et al.2009和Microsoft COCO数据集Lin等人2014年。这些图像数据集包含数千个随机选择和标记的代表性图像例如人、动物、物体等。然后这些代表性的图像数据集被分为训练、测试和验证数据集用于CNN应用。由于CNN在计算机视觉中的成功它迅速成为直接从原始地震数据或偏移图像预测速度模型的流行工具Araya-Polo等人2018; Lin Wu2018; Liu等人2021; Wang Ma2020; Yang Ma2019; Zhang Gao2021。预测速度模型的这些CNN应用取代了传统的波动方程引导过程例如计算FWI和RWI中的模型梯度以拟合地震数据通过训练CNN来近似训练数据集中的映射关系。因此传统FWI和RWI中的关键问题例如更新速度模型、循环跳跃等转换为训练速度模型的选择偏差和CNN的过拟合。过度拟合是一种现象Chicco2017即CNN训练中最小化的性能误差不会导致CNN更准确地预测未知的真实速度模型。因此训练速度模型是否代表未知的真实速度模型或者未知的真实速度模型是否在训练模型的分布范围内成为应用CNN预测速度模型的有效关注点和关键问题。 不像具有相对小种类的目标的类型、形状和轮廓的图像数据集例如人、动物、物体等地球包含现实的、复杂的地质模型其具有许多随机形状的各种层、盐和断层。更糟糕的是大多数地质模型要么是未知的要么不是开放的。为了弥补缺乏代表性的真实速度模型许多CNN应用程序依赖于训练速度模型这些模型是根据特定规则生成或选择的而不是目标区域中真实地质结构的先验信息。Araya-Polo等人2018生成了具有随机断层和盐体的速度模型。Lin和Wu2018以及Zhang和Gao2021生成了具有随机平坦地下层和具有断层的弯曲地下层的速度模型。Yang和Ma2019生成了具有平滑界面曲率和随深度增加的速度值的随机速度模型。然后将具有随机形状和位置的盐体嵌入到每个随机模型中。Wang和Ma2020将自然图像例如从Microsoft COCO数据集其结构和细节丰富到速度模型。Liu等人2021通过应用多个随机三角和线性方程生成连续、波动和复杂的曲线生成致密层、断层和盐体模型。因此以这些方式创建的随机速度模型或多或少地受到选择偏差的影响即速度模型不能合理地表示目标区域因为它们不是从相同的分布绘制的。因此将随机速度模型划分为训练、验证和测试数据集来训练和测试CNN由于随机速度模型的选择偏差不能保证准确预测目标区域中的真实速度模型。 Kazei等人2021年提出通过应用复杂的图像处理程序翻转、裁剪、失真等从引导模型生成随机速度模型。然后训练CNN以近似从完整地震波形到1D垂直速度剖面的映射与2D速度模型相比1D垂直速度剖面更随机地采样和选择具有更少的选择偏差。因此他们的方法可以有效地训练一个过拟合程度较低的CNN来反演速度模型剖面。基于给定的起始速度模型而不是随机速度模型集来训练CNN的另一种方法是将CNN应用为函数逼近器以重新参数化然后替换给定的起始速度模型以自动捕获其显著特征作为CNN域FWI中的先验信息He Wang2021; Wu McMechan20182019; Zhu等人2022年。然后CNN域FWI迭代地将反演主要约束到CNN隐藏层中的这些捕获的特征作为隐式正则化以最小化数据残差。在反演之后CNN准确地预测速度模型。尽管CNN域FWI不需要代表性的训练速度模型集但需要起始速度模型如传统的FWI和RWI所做的那样起始速度模型中不太显著的特征其在预训练步骤中不由CNN自动捕获不能被CNN域FWI准确地反演。因此CNN域FWI比FWI或RWI更适合于针对具有显著特征例如盐体。 在本文中我们提出了一个基于卷积神经网络的反射波形反演CNN-RWI迭代应用CNN预测速度模型从原始的起始速度模型和相应的原始偏移图像这两者形成的先验信息顺序地通过地震预处理获得。CNN-RWI主要包含两个循环。内循环是CNN训练步骤其迭代地训练CNN以从对应的训练起始速度模型和训练迁移图像近似训练速度模型。提出的CNN-RWI和传统的CNN应用程序之间的主要区别是预测速度模型的外循环。预测速度模型的传统CNN应用程序仅遵循三个连续的主要步骤训练模型准备CNN训练和CNN预测。相比之下CNN-RWI的外循环迭代地遵循这三个顺序步骤直到CNN-RWI收敛例如数据或传播时间误差被最小化。具体地在CNN-RWI的外循环中通过应用所提出的分组方法来划分在先前迭代中获得的CNN预测的速度模型以生成随机训练速度模型来准备训练速度模型。然后在对最新生成的随机训练速度模型进行CNN训练之后应用CNN从原始起始速度模型和对应的原始偏移图像再次预测未知的真实速度模型。然后在下一次迭代中将对CNN预测的速度模型进行分区以准备训练速度模型。双循环机制使CNN-RWI能够动态调整选择偏置训练速度模型以从原始起始速度模型和相应的原始偏移图像逐渐预测更准确的速度模型。因此CNN-RWI不是像FWI或RWI那样最小化数据残差而是以迭代深度学习的方式将训练速度模型以及CNN预测的速度模型的分布动态地移向未知的真实速度模型以隐式地减少选择偏差。 CNN-RWI与FWI、RWI、预测速度模型的CNN应用和参数CNN域FWI相比具有以下优点。首先对于更深的速度模型的反演FWI和RWI主要更新界面和背景速度分别而CNN-RWI有效地更新它们。其次FWI和RWI都依赖于较低频率的数据使得走时误差在半个周期内以避免在数据拟合过程中的周期跳跃而CNN-RWI更喜欢较高频率的数据以获得较高分辨率的偏移图像作为CNN输入数据因为CNN-RWI不需要数据拟合过程。第三用于预测速度模型的常规CNN应用可以被视为CNN-RWI的特殊情况其在外循环中仅具有一次迭代以训练CNN以准确地近似训练模型其通常不能表示目标区域中的未知真实的速度模型并且因此表现出选择偏差。最后参数CNN域FWI更准确地反演了起始速度模型中的显著先验特征但未能有效地应用具有显著反射主导界面的FWI梯度来更准确地更新速度模型的更深部分。相比之下基于CNN的RWI结合了起始速度模型和偏移图像中的先验信息以准确预测所有深度的速度模型。 本文的结构如下。我们首先介绍了CNN-RWI算法的流程图。然后在合成实施例部分中将CNN-RWI与由PySIT工具提供的共轭梯度FWICG-FWI进行比较Hewett等人2020以反演Marmousi 2 P波速度模型的三个不同部分Martin等人2006年。在这些裁剪的Marmousi 2模型上的合成实例表明CNN-RWI优于CG-FWI来反演速度模型。合成的例子还表明CG-FWI的第二遍需要帮助CNN-RWI进一步反演的速度模型的较浅的部分这是部分省略的CNN-RWI在第一遍。
二、Methodology of CNN-RWI—CNN-RWI方法 CNN-RWI是一种迭代反演利用CNN从初始速度模型和相应的原始偏移图像重复预测速度模型。假设初始速度模型是通过反射层析成像或基于偏移速度分析MVA从观测数据中获得的。通过RTM可以得到相应的原始偏移图像I(x)其中图像由下式给出 其中和分别是在x的位置和时间t处传播到起始速度模型的源波场和接收器波场。T是最大时间。 图1显示了CNN-RWI的工作流程其中包含外部和内部循环。 内部循环是CNN训练迭代更新CNN以适应训练速度模型图1中的红框。 其中外循环见图1桔色箭头又可分为五个部分 1准备随机速度模型作为训练标签见图1紫色框2CNN训练即内循环见图1红色框3CNN预测见图1黑色框4误差估计见图1 Error evaluation5动态调整训练样本集见图1向上的桔色箭头。 在CNN-RWI开始时一旦计算出初始速度模型和对应的原始偏移RTM图像将其固定并在每次迭代时反复输入到CNN中在CNN的预测部分黑框中预测未知的真实速度模型。由于CNN预测的CNN输入数据在每次迭代时都是固定的所以CNN-RWI的主要任务是动态调整选择偏差较小的训练速度模型来更新CNN。因此CNN-RWI的核心思想是训练速度模型对未知真实速度模型的表达越好CNN训练部分的过拟合就越少CNN对未知真实速度模型的预测就越好。 图1 CNN-RWI算法流程图。右侧红框和黑框内子流程图为相应左边红框和黑框的细节部分
2.1 Preparation of the Training Velocity Models—训练速度模型的准备 CNN—RWI的一个关键是从先验速度模型紫色框中准备训练模型。对于CNN-RWI的第一次迭代最佳先验速度模型是初始速度模型它通常通过对观测到的地震速度进行预处理如走时层析成像或MVA来预估未知的真实速度模型。在接下来的CNN-RWI迭代中最佳先验速度模型成为最新的CNN预测速度模型。 训练速度模型的准备包括两个主要过程从先验模型生成模型基础从模型基础生成训练速度模型。通过将先验速度模型分割成空间相关和连通的特征来创建模型基础。然后利用模型基础建立训练速度模型。
2.1.1. Generation of the Model Basis From a Prior Velocity Model—从先验速度模型生成模型基础未完 文章提出了一种空间约束的分层K-means分割方法将速度模型分割为空间相关和连接的特征作为模型的基础。McMechan1983a提出了区分图像并寻找局部最大值以包裹偏移的公共中点剖面。因此该方法分割的特征数量取决于图像的梯度。传统的k-means方法Forgy1965; Lloyd1982; MacQueen1967也不适用于分割因为传统的k-means方法不能保证空间连续性。所提出的parcellation方法结合了k-means与区域增长在分裂自上而下的层次结构。 一个临界超参数是最小特征尺寸的阈值它是决定特征是否需要进一步细分的标准。该阈值在衡量每个特征的均匀性和最小尺寸方面起着关键作用。阈值应设置为最大化特征的数量而不会产生无意义的小的散射区域。本文所提出的分割方法的数学解释被分成以下七个步骤并且在算法1的伪代码中描述。
步骤一K-mean聚类的应用 应用k-means聚类方法k 2将先验速度模型V划分为两个不相交的聚类C1和C2其中 通过最小化损失函数获得两个不相交的聚类C1和C2。
算法1空间约束分裂层次k-meansprocedure 当模型的大小网格点数量小于阈值时设置一个阈值作为停止标准。空间约束k-means模型 if 模型大小≥阈值则 1.根据速度分布应用k2时的k-means将模型划分为两个聚类簇a和b 2.分别找出聚类a和b最大区域x和y 3.让区域x和y竞争合并模型中的其它区域 4.根据区域x和y将模型拆分为子模型A和子模型B 5.空间约束k-means子模型A 6.空间约束k-means子模型B end if 7.将模型保存为叶子节点模型基础中的一个组件end procedure 其中v(p)表示模型网格点p处的速度而ui表示Ci中速度的平均值。K-means聚类方法基于速度分布将速度模型V划分为聚类C1和C2而不考虑空间关系和连接。因此集群C1和C2可以包括许多空间上不相关和不连通的小区域应当避免这些小区域在相应的地震数据中产生不想要的散射伪影。
步骤二找出最大的区域 通过独立地计算每个聚类C1和C2中的每个空间上不相交的区域中的网格点的数量相应的最大空间上连接的区域被分别选择为S1和S2。
步骤三应用区域增长 速度模型V被重新划分为三个不相交的簇V{S0,S1,S2}其中和是步骤二中选择的区域并且然后基于曼哈顿距离将每个模型网格点合并到或中使用 其中对于被定义为对于2-D模型 其中x和y是水平和垂直坐标S表示簇中的网格点对于。 区域生长步骤通过迭代合并分别与聚类和中的每一个相邻的模型网格点来数值地实现。
步骤四将速度模型拆分为两个子模型 在区域生长完成之后速度模型V最终被分割为两个空间相关且连接不相交的子模型S1和S2。 步骤五和六递归地包裹子模型 然后空间相关且连接的不相交子模型S1和S2被分别递归地分割直到子模型大小待分割的子模型中的网格点的数量小于阈值最小容许特征大小。
步骤七保存特征作为模型基础的元件 如果子模型大小要分割的子模型中的网格点的数量小于阈值最小容许特征大小则子模型将不会被递归地分割。相反它将被保存为模型基础的组件即它变成分层树中的叶节点。通过步骤1-7中的递归分块速度模型V必然被分块为许多空间相关且连接的不相交特征子模型作为模型基础 V{S0,S1,...,Sn} 其中n是特征的数量。 ,if i≠j 2.1.2. Generation of the Training Velocity Models From the Model Basis—从模型基础生成训练速度模型 在获得模型基{S1S2...Sn}之后可以基于模型基的每个分量中的速度的平均值ESi和方差VarSi创建训练速度模型如 和 其中Ni是每个组件地块Si中的网格点的数量。然后通过将从模型基础中的组件的速度分布中提取的随机值分配给它们自身获得随机训练速度模型集: 每个特征分配随机值等式11不仅增加了训练速度模型的多样性而且还创建了具有许多不同均匀层每个均匀层具有均匀速度的训练速度模型。任意两个相邻的均匀层之间的速度对比在训练速度模型中产生具有不同反射率的反射体这确保了对应的训练地震数据包含反射同相轴就像观测数据一样。
2.2. CNN Training—CNN训练 在准备阶段第2.1小节中创建训练速度模型之后从对应的速度模型集合中计算地震数据。然后还要经过一致的预处理比如反射层析成像或基于偏移速度分析MVA得到初始训练速度模型集合。因此以与从观测数据获得初始速度模型V0和RTM图像I0相同的方式从合成数据获得初始训练速度模型集合和训练RTM图像集合。 2.3. CNN Prediction—CNN预测 在CNN预测中图1中的黑框原始起始速度模型和对应的RTM图像的组合被输入到经训练的CNN以预测未知的真实速度模型 其中Vp是CNN预测的速度模型。
2.4. Error Evaluation—误差评定 在通过CNN预测速度模型Vp之后需要进行正演建模以获得用于误差评估的相应合成地震数据例如计算最小二乘数据残差。与通过在每次迭代时最小化数据误差来更新速度模型的常规FWI不同CNN-RWI计算用于CNN预测的速度模型Vp的准确性的间接评估的数据误差。如果从CNN预测的速度模型Vp获得的数据误差不满足收敛标准例如最小数据误差的阈值则CNN预测的速度模型Vp将成为最新生成的先验模型其将被分组以生成训练速度模型集子部分2.1用于下一次迭代。
2.5. Dynamic Adjustment of the Training Data Set—训练数据集的动态调整未完 上文第2.1-2.4小节介绍了CNN-RWI外环中的四个主要部分图1。除了从先验速度模型生成训练速度模型第2.1小节中固有的新奇之外CNN-RWI的另一个关键新颖性是在外部循环中的每次迭代时基于最新的先验速度模型对训练数据集进行动态调整由图1中的橙子箭头指示。最新的先验速度模型被定义为第一次迭代时的原始起始速度模型V0或者在随后的每次迭代中获得的CNN预测的速度模型Vp。
三、Numerical Examples—数值算例 图2 Marmousi2 P波速度模型。Marmousi2速度模型的三个不同部分黑色、红色和青色框中是测试1和2中使用的三个真实速度模型A-C。 在本节中Marmousi2 P波速度模型的三个部分网格256×256用作真实速度模型A、B和C图2中黑色、红色和青色的区域。对三个真实速度模型A、B和C的合成测试被分为测试1和测试2分别由3×3高斯滤波器平滑400和1600次迭代的初始速度模型以减轻预处理如走时成析成像或MVA。测试1和2比较了CNN-RWI与CG-FWI的性能和灵敏度CG-FWI由PySIT公司提供Hewett等人2020年以不同的精度的启动速度模型。模型的垂直和水平范围为3.2 km空间采样增量为0.0125 km。将原始Marmousi 2 P波速度模型裁剪为三个平方速度模型A、B和C的原因是为了评估CNN-RWI和CG-FWI的性能以有效且高效地更新来自反射数据的速度模型的较深部分。为了模拟观测数据每隔0.125 km设置25个主频率为20 HzCG-FWI为7 Hz作为参考组的爆炸Ricker小波源每隔0.0125 km设置256个接收器。所有的信号源和接收器都在地面上。记录时间为3.5 s时间采样增量为1.0 ms。 在这里本文使用U-net CNN图3Ronneberger等人2015来预测速度模型经验表明该模型是用于生成任务的强大且有效的CNN架构Ronneberger等人2015; Yang Ma2019。CNN架构图3中的下采样和上采样分别通过卷积和转置卷积操作实现步幅为2。 由于本文的主要贡献是CNN-RWI算法第2节中的方法和图1中的工作流程而不是CNN架构的进步因此也可以使用其他CNN架构只要它们可以准确预测CNN训练中的训练速度模型第2.2小节。 图3 U-net卷积神经网络架构。黑色层是输入层其中起始速度模型和逆时偏移图像被连接为两个通道。红色层是输出层它在卷积神经网络CNN训练公式13或CNN预测公式14中输出速度模型。下采样和上采样分别由卷积和转置卷积实现步幅2。 为了在每次迭代时准备具有24个样本的训练模型集应用空间约束、分割、分层k均值分组方法第2.1.1小节以分别从第一次迭代的初始速度模型或从后续迭代的CNN预测速度模型构建模型基础。这种分割方法的阈值设置为655即模型网格点总数256 × 256 65536的1%。阈值应设置为最大化模型基础中的组件数量分层树中的叶节点的数量并限制不创建无意义的小散射区域。这个阈值的另一个考虑因素是计算成本。 阈值越小分层树的深度就越大因此以指数方式增加了将子模型进一步打包成更小特征作为模型基础的组件的计算时间。所以我们将阈值设置为655即模型网格点总数65536的百分之一以平衡模型基础的质量和计算成本。对于包含大规模盐体或储层的速度模型CNN域FWIHe Wang2021; Wu McMechan20182019; Zhu等人2022以将反演主要集中到初始速度模型中的先验特征例如盐体、储层等因为正则化可能比CNN-RWI更合适。CNN域FWI和基于CNN的RWI之间的比较超出了本文的范围因此留待将来比较。 CNN-RWI的快速收敛性在 16 次迭代中从原始起始速度迭代预测速度模型及其对应的原始迁移图像。然后使用这些速度模型作为 CG-FWI 的起始速度模型在第二次中再进行 39 次迭代。因此基于与CNN-RWI相同的初始速度模型通道一中的CNN-RWI和通道二中的CG-FWI55次迭代的总迭代次数是CG-FWI110次迭代的一半。
3.1. Test 1: Synthetic Tests on the More Accurate Starting Velocity Models 图4直观地比较了两遍CNN-RWI图4d-4i和一遍CG-FWI图4j-4o反演的速度模型通过使用初始速度模型图4a-4c通过400次3 × 3高斯滤波器的应用获得以平滑图2中黑色、红色和青色框中的真实速度模型A、B和C。图4d-4f是第16次迭代时的CNN-RWI反演速度模型基于主频为20 Hz的震源使用初始模型图4a-4a作为第1遍中的起始速度模型。图4g-4i显示了第39次迭代时的CG-FWI反演速度模型基于主频为20 Hz的震源使用CNN-RWI反演速度模型图4d-4f作为第2遍中的起始速度模型。图4j-4l和4m-4o显示了第110次迭代时的CG-FWI反演速度模型分别基于主频为20和7Hz的震源使用初始模型图4a-4a作为起始速度模型。图5显示了图4中的模型与相应的真实速度模型A、B和C图2之间的相应模型残差。图6d-6o使用图4d-4o中的反演速度模型与初始速度模型图4a-4c之间的模型残差来视觉分析初始速度模型的哪些部分分别由CNN-RWI和CG-FWI主要更新。图7直观地比较了图4中速度模型的RMS速度模型误差测试1中每个深度的所有位置。 图4和图5直观地证明了两遍CNN-RWI对速度模型的反演第一遍为图4d-4f和5d-5fd第二遍为图4g-4 i和5g-5i比CG-FWI更准确图4j-4o和5j-5o分别为20和7Hz的结果尤其是在速度模型的较深部分。图6d-6f显示出了第1遍中的CNN-RWI在几乎所有深度处将速度模型图4d-4f中的背景速度和界面显著地更新到正确的方向。通过比较CG-FWI主要更新较浅的背景速度以及所有深度的界面图6a-6c和6j-6o这与FWI梯度的理论和数值分析一致Alkhalifah2014; Wu Alkhalifah2015; Xu等人2012; Yao等人2020年。图7定量地说明了在通道1中由CNN-RWI反演的速度模型图7中的红线在几乎所有深度处具有比由CG-FWI反演的速度模型图7中的黑色和洋红色线相对更低的RMS模型误差。通道1中CNN-RWI反演速度模型的模型误差相对较低图7中的红线导致通道2中CG-FWI反演速度模型的RMS模型误差最小图7中的蓝线。 图8基于均方根模型误差和归一化数据误差定量比较了CNN-RWI和CG-FWI。与通道1(图8a-8c中的红线)中由CNN-RWI反演的速度模型(急剧减少和快速收敛)相比对于20和7赫兹数据(图8a-8c中的黑色和洋红色线)由CG-FWI反演的速度模型逐渐减小并缓慢收敛到相对更高的均方根模型误差。图8a-8c中的青色点对应于在CNN-RWI的前16次迭代中的24个训练速度模型的均方根模型误差。它验证了CNN预测的速度模型在每一次迭代中都比训练速度模型更准确的假设这是CNN-RWI迭代预测越来越准确的速度模型的关键动机。图8a和8d示出了用于7赫兹情况的CG-FWI(图8a和8d中的洋红色线)在第46次迭代(由图8a和8d中的洋红色圆圈指示)处陷入坏的局部最小值以通过错误地增加位于图4m中深度2.1公里以上和以下的两个突出层中的速度来继续最小化数据误差(图8d中的洋红色线)。因此随着CG-FWI(图8a和8d中的洋红线)中数据误差的减少模型误差从第46次增加到第110次。与之相反用CNN-RWI-反速度模型作为初始速度模型在PASS 2中由CG-FWI反演的速度模型逐渐变得更精确因此RMS模型误差和归一化数据误差在每次迭代(8a和8d中的蓝线)都减小了。 图8显示CNN-RWI(图8a-8c中的红线)的RMS模型误差在最初的几次迭代中急剧减少然后以轻微的波动收敛而CNN-RWI(图8d-8f中的红线)的归一化数据误差急剧减少但随后以严重的波动收敛。这些波动行为不一致的主要原因是CNN-RWI应用了在每次迭代(子节2.5)从动态可调整的训练数据集中逐渐学习的近似空间映射来预测速度模型而不是像FcWI那样稳定地最小化数据误差。当CNN预测的速度模型不太准确时训练数据集中的空间映射(第2.2小节)有效地指导CNN预测更准确的速度模型这对应于RMS模型误差和归一化数据误差(图8中前几次迭代中的红线)的急剧减少。这些更精确的速度模型仍然包含局部区域速度的一些变化由于高度非线性的CNN对速度的预测不完善这些变化的速度和位置在每次迭代中都可能改变。随着CNN预测速度模型的平均精度显著提高这些局部速度误差和相应的数据误差不再占主导地位因此均方根模型误差和归一化数据误差在最初的几次迭代中都不会波动。然而当CNN预测的速度模型收敛时CNN预测的速度模型的平均精度不会大幅提高。因此CNN预测速度模型中局部误差的方差(轻微起伏)在影响数据误差(剧烈起伏)中起主导作用。由于地震数据对模型误差非常敏感数据误差的波动要比模型误差大得多。 比较了CNN-RW I和CG-FW I在不同模型(图4-8)上的性能结果表明对于几乎所有深度的速度模型(特别是背景速度模型)CNN-RW I在速度模型(尤其是背景速度模型)上的性能都优于CG-FW I。相比之下CG-FWI有效地更新了沿俯冲和折射波较浅的背景速度模型。深部速度模型中的背景速度和界面可以通过CG-FWI进行更新但精度较低甚至可能被错误的方向更新。通过在PASS 2中应用CG-FWI继续对速度模型进行反转而PASS 1中的CNN-RWI可以更好地恢复速度模型CG-FWI可以有效地更新界面但不能更新背景速度模型(图6a-6c)。因此对于几乎所有深度的所有速度模型CNN-RW I比CG-FW I更准确地反演速度模型(图4-8)。
3.2. Test 2: Synthetic Tests on the Less Accurate Starting Velocity Models—试验2不太精确的初始速度模型的综合试验 为了分析CNN-RWI和CG-FWI的性能对起始速度模型的准确性的灵敏度使用较不准确较平滑的初始速度模型图9a-9 c并遵循与测试1中完全相同的测试和比较程序对两种方法进行测试以反演速度模型。初始速度模型图9a-9 c通过1600次应用3 × 3高斯滤波器来平滑图2中黑色、红色和青色框中的真实速度模型A、B和C而获得。与测试1中包含显著特征的更准确的起始速度模型图4a-4c相比测试2中的初始速度模型图9a-9 c过于平滑无法包含显著特征。 类似于测试1中的结果CNN-RWI优于CG-FWI在20和7 Hz两者下来反演速度模型比较图9d-9 f与图9 j-9 o。然而测试2图9中的所有反演结果都不如测试1图4中相应的反演结果准确。图4和图9的比较表明CNN-RWI和CG-FWI都对起始速度模型的准确性敏感。 图10 d中的残差模型显示CNN-RWI在正确的方向上稍微更新了位于2.1 km深度以上和以下的两个突出层。相比之下图10 j和10 m显示CG-FWI错误地更新了速度模型中的这些突出层图9 j和9 m。每个深度所有位置的RMS模型误差图11 a定量验证了20和7 Hz CG-FWI的RMS模型误差与其他参数相比最高比较图11中箭头1-4所示的RMS误差。相比之下在通道1中由CNN-RWI反转的这两个突出层以及在通道2中由CG-FWI反转的这两个突出层分别为图11 a中的红线和蓝线是最低的。实际上图9-11说明了在测试2中在第1遍中由CNN-FWI反演的速度模型以及在第2遍中由CG-FWI反演的速度模型是几乎所有深度处的最准确结果。 图12显示了测试2中CNN-RWI和CG-FWI的RMS模型误差和归一化数据误差与测试1图8中的趋势相似但测试2中的所有模型和数据误差水平均高于测试1。CG-FWI反演的速度模型的速度模型误差增加20和7 Hz情况而相应的数据误差减小就像测试1中的那些一样比较图8a和12 a以及图8d和12 d中的黑色和洋红线。与CNN-RWI对应的RMS模型误差和归一化数据误差显著降低并收敛到高于测试1的误差水平比较图8和图12中的红线。模型和数据误差曲线的波动分别与测试1中的波动相似比较图8和图12。模型和数据误差曲线趋势方向相反的根本原因已在前一小节中分析因此此处省略。 使用不同的初始速度模型测试1中的图4a-4c和测试2中的图9a-9 c对Marmousi模型的三个部分图2进行的合成测试表明CNN-RWI和CG-FWI的性能对真实速度模型的复杂性和相应初始速度模型的准确性都很敏感。合成试验1和2还表明CNN-RWI反演速度模型比CG-FWI更准确几乎在所有深度。
四、Discussion—讨论 我们说明了CNN-RWI如何从原始起始速度模型和相应的偏移图像迭代地预测越来越准确的速度模型而不需要传统FWI中的数据拟合过程例如CG-FWI。CNN预测的速度模型的最高精度部分地受到原始起始速度模型的精度的限制原因有两个。首先所使用的原始起始速度模型越精确原始偏移图像将越精确。它们都减少了从自身到未知真实速度模型的空间映射的不适定性这使得CNN能够更准确地预测速度模型第2.3小节。第二更精确的原始起始速度模型包含更丰富和精确的用于生成模型基础的先验信息这增加了准确性即减少选择偏差。因此CNN-RWI显然取代了传统FWI中的数据拟合过程通过CNN训练和预测。然而CNN-RWI需要起始速度模型中的准确先验信息来减少映射的不适定性并为CNN训练生成更准确的模型基础就像传统FWI需要更好地解决循环跳跃问题一样。在合成试验1和2中通过应用3 × 3高斯滤波器分别对真实速度模型进行400次和1600次迭代来平滑以模拟预处理从而获得起始速度模型。综合测试1和2清楚地表明无论是传统的FWI和CNN-RWI是敏感的起始速度模型的准确性以及未知的真实速度模型的复杂性。CNN-RWI与现有技术的FWI诸如正则化FWIEsser等人2018; Guitton2012; Peters Herrmann2017超出了本文的范围。因此留待今后研究。 在从先验速度模型生成模型基础的过程中第2.1.1小节所提出的空间约束的划分分层k均值分割方法与常规k均值聚类之间的主要差异之一在于所提出的分割方法保留了以下之间的结构关系以及每个特征内的连通性更合理、更适合于训练速度模型的建立。相比之下传统的k-means聚类方法Forgy1965; Lloyd1982; MacQueen1967可能包含许多空间上不相关和不连通的区域这些区域成为不需要的散射点。另一个主要区别是分组的目的。传统的k-means聚类旨在通过最小化稀疏模型和密集模型之间的差异将密集模型具有相对大量的参数聚类并压缩为稀疏模型具有相对较少的参数。因此稀疏模型压缩传统的k-means聚类方法仍然是一个精确的近似和替代密集参数模型。相比之下CNN-RWI中聚类的目标是将先验速度模型分割成小特征作为模型基础以创建具有不同均匀特征和尖锐边界的随机训练速度模型作为先验速度模型的相对低维随机扰动。然后这些训练速度模型用于表示CNN训练的未知真实速度模型。因此训练速度模型所提出的分割方法创建被认为是极其有损和不可接受的稀疏模型在其重建和压缩方面因为训练速度模型没有被优化以适应先验速度模型而是根据先验速度模型创建随机扰动。 在传统的FWI例如CG-FWI由于数据失配在每次迭代时被最小化归一化数据误差曲线通常减小。相比之下CNN-RWI不需要像FWI那样最小化数据错拟合函数来更新速度模型。相反初始速度模型层析成像分量和原始高分辨率偏移图像偏移分量被重复输入到CNN作为先验信息以约束CNN基于这些先验信息以及从动态调整的训练数据集学习的空间映射来预测速度模型第2.5小节。然而数据不拟合以及其他验证工具例如时间不匹配等可以用作质量指标来分析CNN-RWI在每次迭代时的性能。 所提出的空间约束的、分裂的、分层的k-means分割方法的计算成本可以被忽略因为在每次迭代中分割先前的速度模型以生成随机训练速度模型是非常快的。因此CNN-RWI的计算成本主要取决于小训练数据集中的样本数量例如以上示例中的24个样本以及获得训练速度模型和训练迁移图像以及CNN训练的效率。在使用合成数据的测试测试1和2中24个样本被实验证明对于GPU环境中的CNN训练是足够的并且非常有效。如果在并行编程环境中获得训练偏移图像则训练偏移图像的计算时间将近似等于一个偏移图像的计算时间这将使偏移处理在每次迭代中效率最高。CNN-RWI最不确定的部分是用于在每次迭代中获得训练初始速度模型的过程。应用原始处理例如时间层析成像或MVA以在每次迭代时获得训练初始速度模型是非常准确的但耗时。相反平滑训练速度模型以模仿原始处理以获得训练速度模型是非常快的但不太准确。因此开发一种更好的方法来平衡精度和计算成本以获得训练起始速度模型是一个关键问题这需要解决将CNN-RWI应用于现场数据的问题但超出了本文的范围。因此留待今后研究。 假设通过平滑训练速度模型获得用于训练的初始速度模型则CNN-RWI的计算时间为 其中和分别是一个训练样本的偏移和CNN训练的平均时间和分别是训练样本的数量和外循环中的迭代次数。在迁移和CNN训练的理想并行编程环境中计算时间变为 其近似等于FWI的计算成本。 其中是用于计算FWI梯度的计算时间是用于步长搜索的计算时间其涉及多次正演建模以最小化合成地震数据与观测地震数据之间的数据残差是反演中的迭代次数。因此在理想的并行编程环境中CNN-RWI的计算时间近似等于FWI的计算时间。随着CNN-RWI收敛得更快即由于CNN-RWI的迭代次数更少并且比FWI更准确地预测了速度模型比较图8和图12因此可以合理地假设CNN-RWI的计算时间相对小于FWI的计算时间。
五、Conclusion—结论 本文提出了一种新的CNN-RWI方法来迭代预测更精确的速度模型。CNN-RWI包含内循环和外循环。内循环训练CNN以根据训练初始速度模型和相应的偏移图像准确地预测训练速度模型。外循环迭代地使用CNN训练后CNN预测的最新先验速度模型为下一次迭代的CNN训练创建更具代表性的训练数据集。从先前的速度模型的训练速度模型的创建是通过所提出的空间约束的、分裂的、分层的k-means分割方法来实现的。外循环迭代地改进训练速度模型使CNN能够逐步预测更准确的速度模型。使用Marmousi 2 P波速度模型的三个部分的合成实例表明CNN-RWI预测速度模型的浅部和深部比CG-FWI更准确。CNN-RWI和CG-FWI都对起始速度模型的准确性敏感。
Data Availability Statement—数据可用性声明
数据https://doi.org/10.5281/zenodo.6578811代码https://github.com/YulangWu/CNN-RWI