作者简介:马福罡 工程师,1989年生,2013年毕业于长江大学资源勘查工程专业,现在中海油能源发展股份有限公司工程技术分公司从事海上油气勘探作业相关工作。通信地址:300452 天津市滨海新区海川路2121号渤海石油管理局C座。E-mail:mafg@cnooc.com.cn
完井地质报告是油气勘探开发的关键成果资料,针对其传统人工编制模式存在的效率低、易出错、规范性差等问题,基于GeoWell软件研发了一套智能生成系统。该系统以中海油EOM数据湖提供的数据为基础,实现录井、测井、测试等多源数据的批量导入与数据解析,以中国海洋石油集团有限公司企业标准为准则,融合地质人员经验,构建可配置规则库与结构化模板,采用“数据接入→规则决策→内容组装→规范输出”闭环架构,结合数据映射、动态内容生成与自动化排版技术,实现从原始数据到标准化报告的一键生成。在渤海油田158口井的规模化应用表明,该系统使报告编制效率提升73%以上,数据准确性与格式规范性显著改善,有效推动地质人员从事务性操作向高价值分析研究转型,为油气地质工作的数字化、智能化提供了范例。
Well completion geological reports serve as critical deliverables in oil and gas exploration and development. Addressing the inefficiencies, error-prone nature, and lack of standardization inherent in traditional manual compilation methods, this study developed an intelligent generation system based on the GeoWell software. Leveraging data provided by CNOOC's EOM data lake, the system enables batch import and parsing of multi-source data including mud logging, well logging, and testing records. Guided by CNOOC corporate standards and incorporating geologist experience, it constructs a configurable rule repository and structured templates. Employing a closed-loop architecture of "data access→rule-based decision→content assembly→standard output", it integrates data mapping, dynamic content generation, and automated typesetting to achieve one-click conversion from raw data to standardized reports. Scaled application across 158 wells in the Bohai Oilfield demonstrates that this system boosts report preparation efficiency by over 73%, significantly enhances data accuracy and formatting compliance, and effectively facilitates the transition of geologists from transactional tasks to high-value analytical research. It provides a model for the digital and intelligent transformation of oil and gas geological operations.
随着数字经济成为国家战略, 数字化转型已成为推动油气产业高质量发展的核心引擎[1]。中国海油制定了《智能油田顶层设计纲要》与《智能勘探总体规划纲要》, 旨在通过数据驱动实现业务模式重构与核心能力提升[2, 3, 4]。在此进程中, 地质资料的智能化处理是数字化转型的关键环节。完井地质报告系统总结了单井从钻前设计至完井的全过程地质信息, 不仅是向国家资源管理部门汇交的法定资料, 也是油气藏评价、开发方案制定及后续钻井设计的重要依据。
传统人工编制模式依赖地质人员手工收集、整理资料, 在“海量、多源、异构”的勘探大数据面前已难以为继, 普遍存在效率瓶颈、人为差错风险、格式规范性不一及专家知识传承困难四大痛点[5, 6]。为解决上述问题, 国内外油服公司与研究机构进行了积极探索。国际油服公司(如斯伦贝谢、哈里伯顿)已将数字化作为核心战略, 推出了DELFI、DecisionSpace等认知工作流程平台, 强调数据的开放集成与工作流程自动化[4]。国内方面, 中国石油提出了“数字中国石油”的转型目标, 冀东油田等油公司通过构建“数据湖-云平台”体系, 在数据治理与管理模式变革方面取得了显著进展[7, 8]。
本文基于中海油广泛应用的GeoWell软件[9, 10], 以Q/HS 1059-2019《探井完井地质总结报告编写规范》与Q/HS 2129-2022《海上油气田开发井完井地质总结报告编写规范》为准则, 深度融合地质人员业务经验, 研发了一套面向油气勘探开发场景的完井地质报告智能生成系统。该系统旨在通过数据驱动和规则引擎, 实现报告编制的自动化与智能化, 其成功应用为破解传统工作模式困局、落实企业数字化转型战略提供了实践路径。
本系统的设计目标是构建一套高效、准确、规范的完井地质报告智能生成系统。通过对渤海油田当前业务需求的深入分析, 确立了“多源数据为基础、企业规范为准则、专家知识为核心、自动化输出为目标”的设计理念, 旨在应对海量、多源、异构地质数据环境下传统报告编制模式存在的效率低、易出错、格式不统一等问题, 最终实现从原始数据到标准化报告的全流程、一体化智能生成。
系统设计遵循“数据驱动、规则引导、模板规范、智能输出”的闭环架构, 模拟资深地质专家的报告编写逻辑:以统一治理的多源数据为输入, 通过内嵌企业规范与专家知识的规则引擎进行智能决策, 驱动内容按需动态组装, 并依托结构化模板确保格式严格合规, 最终一键输出高质量的标准化报告。
为实现智能生成目标, 本系统构建了4层闭环总体架构(图1)。该架构以数据流为主线, 定义了从原始数据接入到标准化报告输出的完整路径, 即“数据接入→ 规则决策→ 内容组装→ 规范输出”。各层级模块化设计, 职责明确, 协同工作, 共同保障报告生成过程的自动化、规范化与高效化。
系统总体架构分为数据层、规则层、生成层和输出层4个逻辑层次, 各层次之间紧密协作, 共同实现从原始数据到标准化报告的全流程自动化。各层功能具体如下。
(1)数据层:系统基础, 负责多源异构数据的统一导入、解析、标准化存储与导出以及数据查询与编辑, 为上层处理提供高质量、结构化的“数据原料”。
(2)规则层:系统智能核心, 内置规则引擎。其基于数据层提供的事实(当前井数据), 匹配规则库中封装的企业规范、专家知识与业务规则, 自动决策报告的结构、必需内容与生成逻辑, 实现报告内容的自动化决策。
(3)生成层:接收规则层的决策指令, 依托预构建的结构化模板库, 将提取计算后的数据、文本描述、图表等元素进行动态组装与精准填充, 形成完整的报告结构化内容体, 保障内容与格式的规范性。
(4)输出层:作为最终环节, 根据井型等信息自动匹配或手动选择标准化Word模板, 将生成层涵盖的内容一键注入, 并强制继承全部预定义样式, 输出可直接交付审阅的规范化报告, 完成从内容到成品的跨越。
本系统通过一套融合了企业规范、地质专业知识与软件工程的技术体系, 实现了从原始数据到标准化报告的自动化生成。
该体系以多源数据导入与智能解析为基础、以规则引擎与动态内容生成为核心, 以结构化模板与自动化填充为保障, 构建了一条完整的智能化报告生产流水线。
地质报告的智能生成首先依赖对多源、异构数据的有效整合与解析。为此, 系统构建了统一的数据接入与解析框架, 以应对不同来源和格式的数据挑战。对于结构化或半结构化数据(如地质原始数据、成果数据表), 系统充分利用中海油EOM数据湖的标准化成果, 通过预置的数据接口模型(如ICommonData用于表格数据, ICurveList用于曲线数据)自动完成格式验证、基础清洗和类型转换, 并提供可视化的模板编辑与字段匹配功能, 使用户能够将导入数据表的列标题与系统内部数据模型的字段精确映射(图2), 确保基础数据源的准确性与一致性。
针对地质日报、地质设计书等非结构化文本资料, 系统采用基于自然语言处理(NLP)与文档结构分析的智能解析技术, 实现关键信息的自动抽取。技术流程包括:利用Open XML SDK等库解析Word/TXT/Excel文档, 识别标题、段落、表格等核心文档结构; 通过预定义的地质领域词典(如井深、层位、油气显示等)和基于正则表达式的模式匹配, 从文本段落中自动抽取“基础数据”“地层及岩性组合”“油气显示级别”等关键地质要素; 定位和解析文档中的复杂表格, 智能识别表头与合并单元格, 并将表格数据转化为结构化记录存入缓存。该机制成功将散落在非结构化文档中的有价值信息转化为机器可理解、可处理的结构化数据, 为报告的自动化生成奠定坚实的数据基础。
规则引擎是系统实现自动化决策与内容动态生成的核心, 其基于产生式规则架构, 将企业规范与专家知识编码为业务规则, 通过算法驱动系统根据数据特征自动判断并组装报告必需的章节、表格与文字。系统采用多层次数据处理策略, 实现从“基础提取”“计算转换”到“逻辑拼接”最终至“条件显示”的精准内容生成。通过动态组装机制, 确保报告内容完整且无冗余。基于内嵌的数据质量控制与容错机制, 在生成过程中自动执行逻辑一致性校验与合理性检查, 保障最终成果的专业性与可靠性。
3.2.1 规则引擎架构与决策逻辑
规则引擎作为系统的自动化决策核心, 基于算法的“产生式规则”架构, 由规则库、事实库与推理机3大组件协同构成:规则库封装了数千条源自企业规范与地质专家经验的业务规则; 事实库实时载入并维护当前井的各类数据特征(如数据存在性、井别类型、作业内容等), 为推理过程提供“事实”依据; 推理机负责实时模式匹配, 当输入的事实完全满足某条规则的条件时, 自动激活并执行该规则对应的动作, 如创建动态附表或触发计算流程。该工作机制模拟地质专家的逻辑判断过程, 实现报告内容生成的自动化与智能化。当业务规范更新时, 仅需调整规则库即可快速响应, 从而保证系统良好的可维护性与适应性。
3.2.2 多层次数据处理策略
面对种类繁多的数据, 系统构建一套精细化的多层次数据处理策略体系, 以适配精准生成报告所需的多样化数据, 建立由简至繁的4级数据处理策略。
该体系从直接读取静态信息的“基础提取”, 演进至进行数学运算的“计算转换”(如计算岩性钻厚、层数、占比), 再到按业务逻辑拼接描述的“逻辑拼接”(如按照层位进行拼接), 最终提升至根据数值智能输出定性结论的“条件显示”(如生油层评价)。这4级策略可灵活组合, 形成复杂的处理链, 确保从数据到报告内容的精准与灵活转换。
3.2.3 动态内容组装机制
在规则引擎的驱动下, 系统实现了报告内容的动态组装, 其核心在于“按需生成”。报告内容被划分为所有报告必备的“强制内容”与由数据触发的“条件内容”。例如, 当系统在数据湖中检测到定量地化录井、荧光分析等数据时, 才会动态生成“油气水层综述”等相关章节与描述。这种机制使得系统能为不同数据完备性和作业复杂度的井, 自动生成从精简到详尽的不同版本报告, 在确保信息完整性的同时, 彻底避免了内容冗余。
3.2.4 数据质量控制与容错处理
为确保生成内容的专业性与可靠性, 规则引擎内嵌了数据质量控制模块。在报告生成前, 该模块自动执行一系列校验规则, 包括逻辑一致性校验(如顶深小于底深)、数值范围合理性检查(如孔隙度在0~1之间)以及数据完整性检查。当发现数据冲突时, 系统依据预设的数据源权威性优先级进行仲裁。对于异常数据, 则进行标记提示或中止生成, 从而在源头上保障了最终成果报告的质量。
该技术通过构建符合企业规范的模板库, 将格式规范预定义为可复用样式, 并为动态内容区域绑定数据源与生成逻辑。系统采用书签定位、内容控件与自定义XML数据岛技术, 实现从文本段落到复杂表格的精准填充。通过程序化接口将数据注入模板并继承预定义样式, 最终自动生成格式规范、内容完整的标准化报告。
3.3.1 标准化模板库构建
标准化模板库的构建是实现报告智能生成的基石, 其本质是将Q/HS 1059-2019《探井完井地质总结报告编写规范》等文本标准通过工程化方法转化为可配置、可复用的数字化模板体系。该过程首先对标准文档进行深度语义解析, 将报告的整体架构(封面、目录、正文章节、附表、附图)和微观内容(段落、表格、图表、数据项)解构成结构化模型, 并在此基础上从2个维度进行固化:①格式层面, 将企业标准中明确定义的版式要求(如一级标题的“宋体、三号、加粗、居中”, 正文的“宋体、小四、1.5倍行距”, 以及表格的边框、字体等)预先设置为Word模板中的“样式”, 通过样式库管理模式确保海量数据填充时报告的视觉呈现保持高度统一与专业; ②内容与逻辑层面, 系统为每一个动态内容单元预定义元数据, 例如为“钻探概述”章节中的“井名”“坐标”等字段绑定数据源为“地质日报”的特定列, 并为各类附表通过预置的逻辑规则(如数据存在性判断)控制其是否在最终报告中出现。该模板库不仅是报告生成的“蓝图”, 更是一个内嵌了企业标准与地质专家经验的智能实体。
3.3.2 智能数据映射与填充机制
为实现数据到文档的精准填入, 系统建立了一套智能的数据定位与映射机制, 采用多种技术混合模式以满足不同颗粒度的填充需求:①对于大段文本内容或需要插入图表的位置, 使用Word“书签”进行宏观定位, 使系统程序能够快速导航至这些“书签”并替换或插入内容; ②对于单个数据字段, 充分利用Word“内容控件”的优势, 将其“标签”或“XML映射”属性与后台数据模型的特定字段绑定, 实现字段级精确填充; ③对于复杂的动态表格数据, 系统采用更高级的“自定义XML数据岛”技术, 将数据库中的整个数据结果集(如地层分层及岩性综述表)序列化为XML格式并整体注入到Word模板预定义的XML部件中, 通过Word根据预置的格式规则自动渲染完整表格, 其填充效果示例如图3所示。
当报告生成指令触发后, 系统的数据处理引擎依据预定义规则完成数据提取与计算, 然后将处理好的结果数据集通过程序化接口(如Microsoft Office PIA)精准“注入”到已标记的位置, 并强制所有新填入内容继承其所在位置的预定义“样式”, 从而在无需手动干预的情况下, 保持报告的格式规范并直接输出内容准确、版式专业的标准化报告。
作为流程的最终环节, 报告输出模块实现了基于井型自动匹配模板与标准化报告的一键生成。首先, 系统根据“井别”“钻井目的”等基础信息自动识别井型(如探井或开发井), 并精准关联对应的标准化Word模板(如探井关联Q/HS 1059-2019模板); 同时, 在任务界面为用户提供手动选择功能, 确保在特殊情况下可覆盖自动选择结果, 兼顾了自动化与灵活性; 最终, 系统将前序流程中动态组装的所有结构化内容与选定模板的格式样式进行精准对接, 通过程序化接口一键输出格式规范、内容完整、可直接用于初审的Word版报告初稿(图4), 从而实现了从原始数据到标准化成果报告的全流程自动化闭环。
为科学、全面地评估基于GeoWell平台的完井地质报告智能生成系统的实际效能, 本研究从效率提升、质量与标准化提升、业务模式与人员角色转变3个维度, 对渤海油田158口探井进行了定量统计与定性分析。
效率提升是本系统最直接、最显著的成果, 通过典型案例对比与批量应用统计两种途径进行验证。
4.1.1 典型案例对比
为排除地质条件复杂性差异的干扰, 精准评估系统带来的效率增益, 选取了地质条件相近、作业内容相似的相邻两口井(BZ-A、BZ-B井)进行“控制变量”的对比。
BZ-A井(传统人工模式):报告编制总耗时19 d。具体时间分配为:数据收集与整理核对1 d、手动计算与统计各类数据3 d、报告文字撰写12 d、图表插入与格式排版3 d。在整个过程中, 地质监督几乎完全沉浸在繁琐的事务性工作中, 难以进行深入的地质分析与研究。
BZ-B井(智能生成模式):报告编制总耗时大幅缩短至3 d。其工作流程重构为:数据导入与预处理0.5 d(约4 h), 系统智能计算与报告初稿一键生成仅0.5 h, 地质监督的核心工作转变为报告审核、地质认识提炼与成果报告修改定稿2.5 d。
对比结论:在该典型案例中, 智能生成系统将单井报告编制周期从19 d缩短至3 d, 减少16 d, 单井效率提升84%。更重要的是, 地质监督的工作重心发生了根本性转移。
4.1.2 批量应用统计
为进一步评估系统的稳定性与普适性, 对近3年完成的158口井进行回溯分析。结果显示, 65口井采用传统人工模式, 平均单井报告完成时间为17.5 d; 而93口井应用智能生成系统, 平均用时降至4.7 d, 效率提升约73%。这表明系统在不同地质条件与作业复杂度下均能稳定高效运行, 显著提升了批量任务的并行处理能力与整体产能。
本系统在提升效率的同时, 对报告质量与规范性实现了根本性改善。首先是数据与格式准确性显著提高, 传统人工模式下, 数据在多次人工转抄、计算与填表过程中易出现差错, 格式调整亦耗费大量时间, 智能生成系统通过数据自动流转与内置质量控制模块, 实现了逻辑一致性校验与数值合理性检查, 使数据与格式差错率趋近于零, 有效避免了反复修改与核对。其次是报告标准化程度全面提升, 系统以企业规范(Q/HS 1059-2019、Q/HS 2129-2022)为基础构建模板引擎, 确保所有生成报告在章节结构、标题层级、字体样式、表格格式等方面完全统一, 标准化率达到100%, 显著提升了其专业形象与审阅、归档的便利性。
本系统深层次的影响在于引发的业务模式变革和地质人员角色的转型升级。如表1所示, 地质监督的工作重心实现了从“操作工”向“分析师”的本质转变。在传统人工模式下, 约80%的工作精力耗费于数据收集、数值计算、表格填报与格式排版等重复性事务; 智能生成系统应用后, 这些工作被系统接管, 地质人员得以将主要精力投入报告审核、地质认识深化、油气藏综合评价及勘探开发决策建议等高附加值工作中。这不仅提升了工作效率, 更释放了专业潜能, 推动地质工作价值回归研究本身, 为油田精准决策提供了更强支撑。
| 表1 两种模式综合对比 |
(1)本研究基于GeoWell软件, 成功研发了完井地质报告智能生成系统, 推动了业务模式与人员角色的升级, 将地质人员从繁琐事务中解放出来, 转向高价值的地质分析, 契合了企业数字化转型中“工作模式变革”与“员工赋能”的核心方向。
(2)应用智能生成系统有效解决了传统人工模式的痛点。通过“数据接入→ 规则决策→ 内容组装→ 规范输出”的技术路径, 实现了报告编制的提质增效, 报告编制效率提升73%以上。
(3)智能生成系统为石油天然气行业数字化转型提供了可复制的实践范例。该系统是数据治理成果向业务应用价值转化的成功体现, 其设计理念与技术架构对上下游业务环节的智能化具有借鉴意义。随着人工智能技术的持续发展, 该系统将进一步向地质文本自动总结与润色、地质知识智能问答与推荐、跨专业数据联动分析与决策支持等方向演进, 最终为实现真正的“智能勘探”与“智慧油田”贡献力量。
编辑 孔宪青
| [1] |
|
| [2] |
|
| [3] |
|
| [4] |
|
| [5] |
|
| [6] |
|
| [7] |
|
| [8] |
|
| [9] |
|
| [10] |
|

