王子健|王彦飞等-Geophysics:测井数据生成的无监督学习与Transformer方法

文章来源: 发布时间:2025-09-08

测井数据在地下资源的勘探和开采中起着至关重要的作用。然而,由于复杂井下环境与勘探成本限制,在实际应用中测井数据经常会存在数据失真或缺失的情况。这不仅影响地层识别与储层评价,还制约了与地震资料的联合解释。因此,如何高精度生成与重建缺失测井数据,一直是油气地球物理研究的重要课题。随着人工智能技术的快速发展,数据驱动的方法在测井生成任务中表现出了强大的性能,但在保证地质一致性和可解释性方面仍面临挑战。因此,必须将地质知识和物理原理等附加约束因素整合到数据驱动模型中,以确保测井曲线生成的高精度和地质可解释性。

油气理论与方法学科中心的博士研究生王子健,在导师王彦飞研究员的指导下,提出了一种融合无监督聚类与Transformer的测井数据生成方法。该方法将Toeplitz逆协方差聚类(TICC)结果作为类岩性约束,引入Transformer模型中,实现了地质先验信息与深度学习的结合,显著提升了缺失数据生成的精度与可解释性。

研究团队首先从岩石物理学的角度出发,认为相同岩性的测井响应通常表现出相似的模式。因此,岩性信息对于测井属性预测任务有着重要指导作用。但在实际勘探中,完整的岩心资料难以获取。为此,团队引入了TICC聚类方法(图1),该方法通过马尔可夫随机场(MRF)刻画变量间的偏相关结构,从多元测井序列中提取类岩性信息,并保持较强的物理可解释性。

图1 TICC将多元测井序列划分为不同的聚类。Log1、Log2、...、LogN 表示不同的测井属性(例如 CALI、RHOB 和 GR)。每个聚类都由一个唯一的MRF表示,此MRF描述了该聚类内任何窗口(w)的偏相关结构

在此基础上,研究者构建了岩性约束的Transformer网络(图2),以声波时差曲线(DTC)的缺失生成为例,建立从多维测井属性到目标曲线的非线性映射关系。该模型依靠自注意力机制捕捉井深序列的长程依赖,同时利用TICC聚类结果或真实岩性标签作为约束,强化模型对地层沉积规律的理解。此外,通过在损失函数中引入高斯分布正则项,有效抑制了预测的不确定性。

图2 岩性约束的Transformer架构。(a)输入测井曲线的嵌入过程;(b)多头注意力机制;(c)前馈层;(d)输出测井曲线的解码过程

北海Volve油田实测资料上的对比实验表明,该方法在十口井上的交叉验证结果均优于传统经验公式(Gardner)、全连接深度神经网络(FCDNN)、卷积残差网络(ResNet)以及双向门控循环网络(BiGRU)模型。其中,Transformer模型在加入岩性或TICC约束后,预测精度显著提高,决定系数R2最高达到0.95。即便在缺乏真实岩性数据的情况下,TICC结果仍能有效替代岩性信息,在测井数据生成中的表现接近真实岩性约束模型,展现出较强的泛化能力(图3)。

图3 使用四种不同类型输入数据的生成效果对比:(a)完整的岩性数据作为约束;(b)归类后的岩性数据作为约束;(c)TICC结果作为约束;(d)仅输入常规的测井曲线。红线表示预测生成的 DTC值,蓝线表示真实的 DTC 值

这一研究突破了传统深度学习“黑箱”预测难以解释的问题,实现了地质知识与深度学习的有机融合,成功地提高了模型的性能和可解释性。方法不仅适用于声波曲线生成,还可推广至密度、孔隙度等关键测井参数的缺失生成,为复杂地质条件下的测井数据完备化提供了新思路。未来研究团队将更广泛地考虑区域地质差异,注重于提升方法的泛化性能。

研究成果发表于国际学术期刊Geophysics(王子健,王彦飞*. Integrating unsupervised learning and transformer for missing log prediction[J]. Geophysics,2025,90 (4):D85–D100. DOI: 10.1190/geo2024-0558.1)。研究受国家自然科学基金项目(12171455,42342062)资助。

王子健(博士生)


附件下载: