作者简介: 向克满 工程师,1986年生,2009年毕业于东华理工大学勘查技术与工程专业,现在中石化西南油气分公司非常规油气勘探开发管理部从事测录井专业技术管理工作。通信地址:404160 重庆市永川区外包园B区B6栋西南页岩气项目部。电话:18628155617。E-mail:543193195@qq.com
川南海相页岩气水平井对优质页岩的钻遇率要求较高,但靶框垂向半径小,随钻测量工具以远端LWD为主,缺乏方位 GR,单靠随钻 GR与主要元素录井信息难以区分靶区的小层。通过优选UMAP算法,针对元素录井数据进行降维处理,通过数据训练获得合适的超参数,建立了靶区小层的判别图板。上井应用表明,3口井优质页岩平均钻遇率94.7%,在缺乏方位 GR的情况下,依靠判别图板能准确识别小层,可靠落实钻头穿行方向,从而确保长穿优质页岩,为水平井地质导向提供了技术支持。
The marine shale gas horizontal wells in southern Sichuan Basin have high drilling-encounter ratio requirements for high-quality shale, but the vertical radius of the target frame is small. The MWD tool is dominated by remote-end LWD and lacks azimuthal GR. It is difficult to distinguish the sublayers in the target areas only by GR while drilling and mud logging information of major elements. By optimizing UMAP algorithm, dimension reduction was processed for element logging data, appropriate hyperparameters were obtained through data training, and the discriminant chart of sublayers in the target areas was established. The chart on well application indicated that the average drilling-encounter ratio of high-quality shale in three wells was 94.7%. In the absence of azimuthal GR, the discriminant chart can accurately identify sublayers and reliably determine the bit travelling direction, thus ensuring long penetration of high-quality shale and providing technical support for the geosteering of horizontal wells.
海相龙马溪组页岩气水平井施工过程中, 如何准确、快速识别小层是能否确保长穿优质页岩的关键[1, 2, 3], 目前国内各个工区基本普及了地质导向技术, 用于随钻过程中的钻头位置落实与待钻轨道优化。一般采用随钻方位伽马、元素录井等技术手段开展小层识别与钻头穿行方向的判别, 并取得了良好的应用效果[1, 2, 3]。随着开发难度的增加, 由于部分工区不使用方位GR测量工具, 同时对靶窗的要求越来越高, 靶框高度由10 m降低到5 m甚至3 m, 而现已形成的小层划分方案, 单层厚度往往超过3 m, 前期总结的小层识别特征已经不能区分, 现有的技术方法已不能满足水平井对小层划分及识别的要求。本文以元素录井数据为分析对象, 采用数据降维算法, 研究建立了一种新的海相页岩地层水平井靶区小层的判别图板, 为水平井的钻头位置识别提供可靠的依据, 也为其他类型油气藏的层位识别提供借鉴思路。
元素录井能获取丰富的地层信息, 目前现场常用的元素录井仪器普遍能测量30余种元素含量, 为页岩气井小层识别、岩相划分、储层评价提供了基础[4, 5]。由于元素种类较多, 每种元素的含量差异大, 难以把所有元素直接绘制成曲线图开展地层判别, 往往需要优选元素开展工作。例如:顾炎午等[6]用10种元素建立永川工区页岩评价参数的多元线性计算方法; 唐诚等[7]在此基础上改进, 用8种元素建立了基于机器学习算法的评价参数计算模型; 刘有武[8]筛选6种元素开展随钻伽马拟合; 唐谢等[9]优选出4种元素建立标准化处理方法。现有的研究成果表明, 大量的元素录井信息没有得到应用。为了利用好丰富的录井信息, 很多学者开展了数据降维的研究工作。郭素杰等[10]应用因子分析方法, 将7个指标降维为2个参数, 建立了复杂油气藏的解释模型; 郭明宇等[11]应用主成分分析算法将5种元素和3种矿物降维建立潜山界面识别二维图板, 取得了较好的应用效果。其他的实例表明, 开展数据降维能有效挖潜录井数据中隐藏的信息, 是目前的研究热点之一。
开展数据降维的主要目的是识别高维数据集中的关键结构, 将它们保存在低维嵌入中, 减轻维数灾难, 减少共线性带来的影响, 同时易于数据可视化并开展应用[12]。元素录井数据种类多, 非常有必要开展数据降维, 在尽可能保留原始多维数据信息的同时, 便于后续的数据分析与应用等工作。常见的数据降维算法分为线性与非线性两大类。主成分分析(PCA)算法是应用最为广泛的线性降维算法之一, 能够快速寻找到原始变量的线性组合, 通过保留少量的主成分, 表征原始数据的主要特征, 因子分析属于PCA的一种特例[10, 11]。但是, PCA等线性算法不能处理高维到低维数据的非线性映射, 而地层岩石中的元素种类和含量往往具有复杂的非线性关系[7]。UMAP(Uniform Manifold Approximation and Projection, 均匀流形近似和投影)是目前最流行的非线性降维算法之一[12, 13]。UMAP算法的原理是在高维空间中寻找距离, 假设数据样本均匀分布在拓扑空间中, 沿着流形搜索数据并计算样本之间的距离, 把数据样本近似映射到低维空间, 在低维空间再现这些距离[14]。也就是说, 该算法主要是学习高维空间中的流形结构, 并找到该流形的低维表示方法。UMAP算法的特点决定了它能够同时保留局部结构和全局结构, 能够从数据中学习非线性模式, 与主成分分析等算法相比, 能更好地分离样本, 因此本文选用该算法作为数据降维方法。
通过分析川南D区的小层特征, 在元素数据中应用UMAP算法开展数据降维, 建立水平井靶区小层的判别图板, 指导水平井地质导向工作。
区块处于深水陆棚相, 沉积了一套富有机质的黑色页岩, 按照中石化标准, 龙马溪组龙一段2-3小层为最优的Ⅰ 类储层[15], 是水平井的主要钻探目的层, 为了最大程度获产, 要求靶区垂向半径2 m, 优质页岩钻遇率大于90%。从图1可以看出, 红色框为靶区, 靶区范围包括2小层全部和3小层底部部分, 其中2小层厚度约1.50 m。从GR曲线分析, 靶区为两峰夹一洼的特征, 两个高GR峰中间为3小层与2小层分界的低GR。从元素特征看, 主要的元素变化不明显, 其中K、Ca元素波动较小, 在靶区内基本无明显变化, Fe、Mg、Al元素的变化特征相似, 进入靶区后则降低, 进入2小层后开始升高, Si元素呈相反的趋势, 进入靶区后升高, 进入2小层开始降低。由于靶心位于3小层底部, 当钻头从靶心向上靶框或下靶框钻进时, 不管是GR还是元素, 均表现为相似的镜像特征, 导致用常规方法难以区分。虽然方位GR能有效判断出钻头上下切的状态, 但工区多数井受井况限制, 或者为了节约施工费用, 往往采用远端LWD单GR结合元素录井开展地质导向。目前的施工现状, 导致了水平井施工过程中难以区分钻遇的小层, 往往要在钻穿2小层高GR峰以后或者钻达上靶框以外的低GR段后才发现, 优质页岩钻遇率得不到保障, 需要研究新的方法, 准确区分开2小层和3小层。
UMAP算法的本质是从高维数据中寻找特征并映射到低维度上, 在这个过程中需要确定关键的超参数, 并建立起数学模型。
2.2.1 算法原理
UMAP算法分为高维空间计算和低维空间计算两步。在高维空间中构造一个特定的加权近邻图, 然后使用有向图布局算法计算出在低维空间的布局, 达到数据降维的效果。
高维空间中, 设X={x1, x2, …, xn}为输入数据集, 对于每个xi(i=1, 2, …, n), 给定一个超参数n_neighbors, 作为最近邻下降法的输入参数计算其最近邻值ρ i、归一化因子σ i以及xi与邻值
低维空间中, 记低维点为Y={y1, y2, …, yn}。理想情况下, 低维应该采用和高维相同的图构造, 但是低维的ρ i值未知, 所以采用超参数min_dist替代并计算获得低维的权重
UMAP算法在高维中采用加权图捕获源数据的拓扑结构, 在低维中构造等价的加权图, 尽可能地匹配源数据的拓扑结构, 达到降维的效果[14, 16]。由于算法较为复杂, 直接计算难度较大, 提出该算法的作者McInnes开源了实现代码, 从而让该算法应用难度大幅降低。以Python语言为例, 安装UMAP包(https://gitcode.net/mirrors/lmcinnes/umap), 调用输入数据集并设置4个超参数后即可进行数据降维[14]。n_neighbors是最重要的超参数, 用来指定用于近似最近邻点的数量, 通过该参数控制UMAP算法平衡局部结构和全局结构, 较大的值更多关注全局结构, 较小的值更多关注局部结构, 该参数推荐设置为5~15。min_dist代表的是低维空间中样本之间的最小距离, 该参数控制UMAP算法将点聚集在一起的紧密程度, 较小的值会导致“ 块状” 嵌入, 较大的值会导致样本分散, 推荐值为0.3。metric定义UMAP算法将使用哪种距离度量来测量沿流形的距离, 例如欧氏距离、曼哈顿距离等。n_epochs定义了优化步骤的迭代次数, 推荐设置为200。默认情况下, 应用UMAP算法降维的结果为二维数据, 分别用UMAP1和UMAP2表示, 均无量纲[14, 16]。
2.2.2 超参数的确定
根据各超参数的意义, 设定n_neighbors、min_dist、n_epochs、metric的取值范围, 通过计算机编程进行循环计算, 绘制不同超参数取值得到的结果, 择优选取合适的模型。本文以D 6井的元素数据为例说明超参数的确定过程。
整理好龙马溪组龙一段3小层和2小层的元素数据, 进行超参数的选取试验, 根据各个超参数代表的意义, 分别设定初始的取值范围。有推荐设置范围的参数, 涵盖推荐的所有范围; 没有推荐范围仅有默认值的参数, 以默认值为中心向两端适当延伸(表1)。
![]() | 表1 UMAP算法的超参数取值范围 |
第一次训练结果表明, 在n_neighbors的取值为3或7时, 结果较为类似, min_dist 为0.5、n_epochs为350左右时数据能明显分为两类, 由于其中min_dist、n_epochs这两个超参数达到了初始设定的值域上限, 而n_neighbors设定的最大值远大于7, 需重新设定各个超参数的值域, 进行第二次训练(图2)。
超参数的选择需要兼顾其代表的意义, 因此一般适宜选择中间的数值。根据图2a分析, 数据能明显区分为两类, 多数超参数条件下两类数据分别位于左上角和右下角, 从数据的分离度考虑, 当n_neighbors取6, min_dist取值0.4或0.6, 或者n_neighbors取4, min_dist取0.7时, 效果最好, 且这几种取值下效果无明显的差别。超参数过大、过小均会对最终结果有一定影响, 因此倾向于靠近推荐值取值, 最终选择min_dist取值0.4, n_neighbors取值6。从图2b分析, 采用曼哈顿距离时效果明显优于采用欧氏距离, 当n_epochs达到400时已经能够明显区分数据, 且数据分类清晰, 区分度较好。
根据训练情况, 最终优选出的超参数结果分别为:n_neighbors取值6; min_dist取值0.4; n_epochs取值400; metric采用曼哈顿距离。
2.2.3 判别图板的建立
应用Python、R等开源编程语言, 引入UMAP库, 设定获得的超参数, 基于D 2、D 3等骨架井数据, 建立本次研究获得的数据模型, 形成了工区内的龙一段2小层和3小层判别图板, 效果见图3。
通过研究建立的小层判别图板在川南D区内应用于3口井, 准确识别了小层, 其中2口井优质页岩钻遇率100%, 1口井优质页岩钻遇率84.1%(受钻遇的6条断层影响), 平均钻遇率94.7%, 为地质导向施工提供了技术支撑。下面以D 15井为例说明。
D 15井入窗后, 顺着靶心钻进, 随钻GR测值为320~340 API, Ca为4.7%~5.3%, Si为28.5%~30.2%, Al为6.1%~6.3%, Fe为1.9%~2.0%, Mg为1.7%~2.0%。当钻至井段4 360~4 370 m时随钻GR升高至370~400 API, 元素特征无明显变化(图4), 由于缺乏可靠的方位GR, 无法判断钻头是上切3小层还是下切2小层。基于UMAP算法计算出4 360 m及4 370 m井深UMAP1为-2.1、-1.2, UMAP2为-1.5、-1.7, 均位于图板的左侧, 远离工区已钻井的2小层, 与3小层位置相似, 据此判断钻头上切3小层; 钻至井深4 428 m随钻GR再次出现升高的情况, 计算UMAP1为-0.3, UMAP2为1.55, 位于图板的左侧, 判断为上切3小层; 钻至井深4 540 m随钻GR第3次升高, 计算UMAP1为2.3, UMAP2为0.2, 位于图板的右侧, 靠近2小层位置, 因此判断钻头下切2小层(图3)。
该井3次钻遇随钻GR升高的井段, 在缺乏方位GR、元素变化特征不明显的情况下, 通过图板均准确判断了钻头穿行状态, 及时采取了轨迹调整措施, 没有发生误判导致出靶。图板的应用为轨迹优化提供了依据, 确保了优质页岩钻遇率。
(1)川南海相龙马溪组页岩气水平井靶区垂向半径小, 随钻GR与主要元素特征相似, 常规手段难以区分, 需要开展新的小层识别方法的研究, 支撑水平井地质导向工作。
(2)通过研究优选了UMAP算法, 针对元素录井数据开展非线性降维, 建立了水平井靶区的小层判别图板, 在缺乏方位GR的情况下, 能有效区分靶区的小层。
(3)元素录井能提供丰富的地层信息, 有必要进一步加强数据信息的挖掘与应用, 更好地支撑油气勘探与开发。
(编辑 陈娟)
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|