1、 第 卷 第 期 年 月 石 油 学 报 基金项目 :国家重大基础研究发展计划 ()项目 “高效天然气藏形成分布与凝析 、低效气藏经济开发的基础研究 ”()资助 。 第一作者及通讯作者 :朱怡翔 ,男 ,年 月生 ,年获合肥工业大学学士学位 ,年获中国地质大学 (北京 )博士学位 ,现为中国石油勘探开 发研究院教授级高级工程师 、博士生导师 ,主要从事储层地质 、地震和测井的综合表征和预测 、复杂岩性储层的测井评价等研究工作 。 : 文章编号 : ( ) : 火山岩岩性的支持向量机识别 朱怡翔 石广仁 (中国石油勘探开发研究院 北京 ) 摘要 :提出了用 种火山岩的岩石类型描述火山岩储层岩性的
2、模型 ,表达岩性对优质储层的控制作用 。基于该模型 ,选取了对火山 岩的岩性 、组构 、成因和孔隙结构反应灵敏的 种岩石物理测井参数 ,分别采用多元回归分析 ( )、人工神经网络 ( )和支 持向量机 ( ) 种机器学习算法 ,尝试火山岩岩性的识别 。在三塘湖盆地马朗凹陷牛东油田的实例中 ,使用了 口井的数据 ,其 中 井和 井的火山岩储层为学习样本 , 井的火山岩储层为预测样本 。利用 井 个样本和 井 个样本 (每个样本含 种测井参数及岩性 ),通过这 种机器学习算法分别获得预测火山岩岩性的知识 ;然后 ,利用 井 个样本 (每个样本仅含 种测井参数 ),根据上述学习获得的知识 ,得到这
3、个样本的岩性 。研究发现 :对于学习样本 , 、 和 的计算与实际的平均相对误差绝对值分别为 , 和 ;对于预测样本 ,则分别为 , 和 。实例分析表明 ,只有 适用于本实例 ,这是由于火山岩岩性与 种岩石物理测井参数的非线性关系十分强烈 。 关键词 :火山岩 ;岩性划分 ;储层 ;岩石物理测井 ;多元回归分析 ;人工神经网络 ;支持向量机 中图分类号 : 文献标识码 : ( , , ) : , , , , , ( ), ( ) ( ), , , , , , , , , , ( ) , , , ; , , , , : ; ; ; ; ( ); ( ); ( ) 近年来 ,随着油气勘探开发难度的
4、不断加大 ,火山 岩作为新的含油气层系 ,正突显出越来越重要的作用 , 展现出广阔的勘探开发前景 。目前已发现的 、具有一 定规模和前景的火山岩系油藏 ,主要分布在新疆三塘 湖盆地 、准噶尔盆地和中国与蒙古接壤的海拉尔 塔 木察格盆地 。 新疆三塘湖盆地有效勘探面积 ,是 一个多层系叠合型含油气盆地 ,发育石炭系 、二叠系和 第 期 朱怡翔等 :火山岩岩性的支持向量机识别 中生界 套成藏组合 ,发现和探明了大量的石油地质 储量 。特别是 年在马朗凹陷牛东油田发现了亿 吨级火山岩油气聚集带 ,展现了三塘湖盆地石炭系火 山岩油藏勘探开发的广阔前景 。 火山岩岩性和岩相的有效识别 ,是火山岩储层评
5、价的一项最重要的基础工作 。在以往的火山岩岩性识 别中 ,主要采用对火山岩岩性敏感的常规测井曲线 ,利 用取心段的岩性描述 ,在相应的岩心段进行多个测井 曲线的分别取值 ,然后将不同岩性段的测井参数值两 两交会 ,建立各个双变量的火山岩岩性识别图版 。 随着测井新技术 (如 元素俘获谱测井 )的应用 ,可 以用 测量地层中主要造岩元素 ( 、 、 、 ) 的百分含量 ,并与常规测井曲线参数值进行交会 ,从岩 石成分角度 ,有效地识别玄武岩 、安山质凝灰岩 、流纹 岩和流纹质凝灰岩等 。 火山岩储层的优劣取决于岩石成分 、结构和构造 、 孔隙结构和裂缝等多种因素 ,即使是同一种岩性 ,如玄 武岩
6、 ,由于其孔隙结构的不同而使其物性产生很大的 变化 ,可以是优质储层与非储层之分 。因此 ,火山岩岩 石的划分和识别 ,应当更加细化 ,要考虑多种因素 ,要 能够反映出储层品质的优劣 ,这样的岩石分类对储层 评价才更有意义 。 由于火山岩岩石的复杂性 ,使得传统的双参数交 会图识别岩性的方法分辨率不高 ,而各个不同的双参 数交会图版在识别火山岩岩性方面 ,彼此交叉和部分 重叠 ,需要一种综合考虑多维参数向量和有效的岩性 识别方法 。刘传平等 曾采用人工神经网络进行火山 岩测井岩性识别的研究工作 。近年来 ,基于不同测井 曲线 ,采用支持向量机进行岩性识别的研究工作已有 成果 。选用的测井曲线为
7、 种 ,识别的对象基本上 是一般的岩性 。例如 :于代国等 利用自然伽马 、 自然电位 、声波时差 、密度 条测井曲线来识别某油田 一研究区的粉砂岩 、泥岩 、砾岩 种岩性 ;李新虎 利 用声波时差 、中子 、密度 、自然伽马 条测井曲线来识 别白音查干凹陷的白云岩 、粉砂岩 、砾状砂岩 、泥岩 、砂 砾岩 、砂岩 种岩性 ;马海等 利用准噶尔盆地 口井 的声波时差 、自然伽马 、自然电位 、密度 、井径 、深感应 、 中感应 、电导率 条测井曲线来识别中砂岩 、细砂岩 、 粉砂岩 种岩性 ;文政等 利用海拉尔盆地乌南地区 口井的 条电阻率曲线 (深感应 、中感应 、微球聚焦 、 深侧向 、浅
8、侧向 )、 条孔隙度曲线 (声波时差 、中子孔隙 度 、补偿密度 )、 条岩性曲线 (自然伽马 、铀 、钍 、钾 )来识 别沉凝灰岩 、凝灰质砂砾岩 、凝灰质砂岩 、砂砾岩 、砂岩 种复杂岩性 ;钟仪华和李榕 利用云南陆良盆地 口井 的自然电位 、自然伽马 、声波时差 、电阻率 、中子孔隙度 条测井曲线来识别泥岩 、含钙泥岩 、钙质泥岩 、砂岩 种 岩性 ;程国建和郭瑞华 利用安纳托利亚东南部某油 田 口井的自然伽马 、声波时差 、岩石体积密度 、中子密 度 、微球形聚焦测井 、深侧向 、浅侧向 条测井曲线来识 别泥岩 、石灰岩 、白云岩 、白云质泥岩 种岩性 。这 篇 文章中 ,在支持向量机
9、进行岩性识别之前 ,有的提取能 够用于岩性识别的测井曲线参数值 ,有的采用主成分 分析法优化测井输入参数 ,有的采用粒子群优化算 法对支持向量机建模过程中的重要参数进行优化调 整 。对于火山岩岩性 ,张莹和潘保芝 使用松辽盆 地深层火山岩地层的 条测井曲线 (自然伽马 、钍 、铀 、 钾 、光电吸收截面指数 、中子孔隙度 )进行支持向量机 识别 ,并采用微电阻率图像模式识别 ,两者结合 ,可以 识别典型的 种火山岩岩性 。 笔者根据新疆三塘湖盆地马朗凹陷牛东油田的火 山岩岩相 、岩性的特点及其与油气显示的关系 ,从储层 评价角度 ,将牛东油田火山岩细分成 种类型 。在此 基础上 ,选取了对火山
10、岩复杂岩性 、物性和孔隙结构反 应灵敏的 种岩石物理测井参数 ,针对 口井的资 料 ,采用支持向量机 ,很好地解决了火山岩岩性的有效 识别这一问题 。 火山岩储层岩性识别模型 国内外对于火山岩岩石学研究很早就开始了 ,但大 多是从岩石化学和地球化学的角度来研究火山岩 。以火 山岩的分类识别为例 ,目前国际上比较流行的火山岩岩 石化学分类方法以 分类图版作为标准 (图 ) ,它 在 年被国际地质科学联合会 ( )火山岩分 类学分委会推荐 ,根据火山岩化学成分的含量 ,将 火山岩分成超基性岩 、基性岩 、中性岩和酸性岩 。 图 火山岩岩石 分类 (据文献 ) 石 油 学 报 年 第 卷 根据火山岩
11、的结构构造和产状可以将火山岩分 为 :火山熔岩 、火山碎屑熔岩 、火山碎屑岩和火山碎屑 沉积岩 。火山碎屑岩根据其碎屑颗粒的大小可以进一 步分为火山集块岩 、火山角砾岩和凝灰岩等 。 在实际火山岩油气藏的储层评价中 ,仅从岩石的 结构构造及其化学成分的分类 ,往往并不能完全代表 火山岩储层物性的好坏和对油气层的控制作用 。比 如 ,在牛东油田的实际岩心观察和岩样分析结果对比 中发现 :即使同种岩性 ,如玄武岩 ,由于处于不同的火 山喷发时期或处于同一时期熔岩流的不同部位 ,其岩 石内部的孔隙结构和物性特征差异很大 ,可以是气孔 裂缝非常发育的优质储层 ,也有可能是仅发育不连通 的微气孔的非储层
12、 。 根据火山岩发育特点和对储层油气的控制作用 , 在储层岩性分类时 ,综合考虑了岩石的 “岩性 组构 成因 孔隙结构 ”诸多因素 ,将牛东油田火山岩油藏 的岩石分成了 种类型 ,并且 ,这些不同的岩性对储层 含油气性的控制作用明显不同 ,从而揭示了岩性对储 层的控制作用 。 在合理的火山岩岩性分类的条件下 ,对于火山岩 岩性的识别仅仅采用通常的几条测井曲线来识别 种 岩性具有很大的多解性 ,需要在高维岩石物理属性空 间中进行 。笔者选取了 种岩石物理属性的测井曲 线 ,采用支持向量机 ,对 种火山岩岩性进行识别 ,获 得很好的成功率 。 牛东油田的火山岩岩性特征与分类 牛东油田位于三塘湖盆地
13、马朗凹陷 ,钻井揭示的 地层自上而下依次为 :第四系 ,第三系 ,下白垩统 ,上侏 罗统齐古组 ,中侏罗统头屯河组及西山窑组 ,下侏罗统 三工河组 八道湾组 ,中 上三叠统小泉沟群 ,中二叠 统条湖组及芦草沟组 ,上石炭统卡拉岗组 、哈尔加乌组 及巴塔玛依内山组 。 牛东油田目的层段为上石炭统卡拉岗组 ,其岩 性以灰色 、褐灰色杏仁状玄武岩为主 ,夹安山岩 、凝 灰岩 、含角砾凝灰岩 、凝灰质角砾岩 、火山角砾岩等 。 然而 ,这些岩性的描述 ,并不能完全体现出岩性对储 层的控制作用 ,亦即优质储层和非储层到底是什么 岩性 。 由于火山岩储层的复杂性 ,制约了火山岩油藏的 高效开发 ,其中 ,
14、如何准确划分和识别火山岩的岩性 , 是火山岩储层评价首先需要解决的一个难点问题 。 牛东油田卡拉岗组火山岩根据岩性通常分成 大 类 (表 ): 熔岩类 ,主要有玄武岩 、安山岩等 ; 火山 碎屑岩类 ,根据其火山碎屑的大小可细分成火山集块 岩 、火山角砾岩和凝灰岩 ; 过渡岩类 ,主要有沉火山 碎屑岩 (以沉凝灰岩为主 ),在本区不发育 。 表 牛东油田卡拉岗组火山岩岩性分类与特征 岩性分类 岩性特征 岩性 成因 孔隙 结构等细分类 岩性特征 气孔杏仁玄武岩 气孔状杏仁体发育 、且处于半充填 ,其中 常含油气 玄武岩 灰色 、褐色 ,斑状结构 ,常具杏仁 状构造 ,杏仁体为绿泥石或沸石 类 ,
15、部分层段见杏仁体溶蚀或半 充填玄武岩 蚀变气孔杏仁玄武岩 杏仁玄武岩处于岩相期次的顶部 ,岩石 有蚀变 脆裂玄武岩 岩性致密 ,气孔杏仁不发育 ,裂缝发育 致密玄武岩 岩性致密 ,气孔 、裂缝不发育 安山岩 灰白色 、灰红色 、黄棕色等 ;半晶 质 玻璃质 、斑状 、似斑状 、微粒 交织结构 、有气孔 、杏仁构造 ,但 气孔细小 气孔杏仁安山岩 有细小的气孔杏仁发育 ,常充填 致密安山岩 岩性致密 ,无气孔杏仁发育 ,处于岩相的 深部 火山集块岩 火山碎屑粒度大于 的占 以 上 ,磨圆差 ,集块间为角砾级凝灰质火山 碎屑 ,本区不发育 火山碎屑岩 杂色 ,以棕色 、灰色为主 。砾石成 分主要为
16、玄武岩及安山岩 ,以深 灰色 、棕色为主 ,砾石分选差 ,砾 石大小常 介 于 ,磨 圆 差 ,压实与胶结强烈 ,砾石之间以 紫红色火山灰 、沸石类胶结为主 脆裂凝灰质角砾岩 具有火山角砾 凝灰结构 ,裂缝发育 凝灰质角砾岩 具有火山角砾 凝灰结构 ,裂缝不发育 凝灰岩 灰绿色 、棕红色 ,细粒 ,块状均质构造或 略具平行层理 、斜层理 过渡岩性 沉凝灰岩或凝灰质砂岩 ,显示与沉积岩的过渡特征 ,如砂岩的粒序 、层理和泥岩的水平纹层等 。该 种岩性在本区不发育 。 根据岩心观察和开发井实际资料发现 ,同样的玄 武岩 ,可以是气孔状杏仁体和裂缝十分发育的高产油 层 ,也可能是非常致密和无油气显示
17、的致密玄武岩 。 并且 ,在玄武岩产出过程中 ,由于冷凝前气孔的向上聚 集作用和炽热的熔岩表面在冷凝中的自碎作用以及后 期风化面的溶蚀和脆裂作用 ,对每一期火山熔岩的溢 第 期 朱怡翔等 :火山岩岩性的支持向量机识别 流来说 ,一般上部的玄武岩表现出杏仁状气孔规模 大 ,连通性好和裂缝发育 ,而在中下部的玄武岩的岩 性致密 ,其中的气孔也很细很均匀 ,气孔之间连通性 差 。安山岩虽然也属于火山熔岩类 ,也具有一定的 气孔杏仁结构 ,但是 ,安山岩往往发育在深部的早期 喷发熔岩中 ,具有半晶质 玻璃质结构 ,气孔细小且 基本充填 ,因此安山岩岩性致密 ,不是有效储层 。裂 缝的发育对火山角砾岩的
18、物性好坏具有重要的控制 作用 。因此 ,火山岩应当结合岩性 、结构 、成因和孔 隙结构的特征进行分类 ,才能客观地体现岩性对储 层的控制作用 。 在岩心描述的基础上 ,结合常规和成像测井曲线 特征 ,采用 “岩性 、结构 、成因和孔隙结构 ”的综合分类 方法 ,将牛东油田火山岩储层的岩石分成了 种类型 (表 ),即 :气孔杏仁玄武岩 、蚀变气孔杏仁玄武岩 、脆 裂玄武岩 、脆裂凝灰质角砾岩 、凝灰质角砾 (熔 )岩 、气 孔杏仁安山岩 、致密玄武岩 、致密安山岩 、凝灰岩 。根 据这 种岩性分类 ,将对应的实际试油结果和气测录 井资料进行统计分析 ,可以得出 ,含油气层主要来源于 种岩性 :气
19、孔杏仁玄武岩 、蚀变气孔杏仁玄武岩和脆 裂玄武岩 。从 口井的气测录井资料中 ,共统计出气 测全烃含量大于 的井段共长 (图 ),在所有 这些有气测显示的井段总厚度中 ,气孔杏仁玄武岩占 ,蚀变气孔杏仁玄武岩占 ,脆裂玄武 岩 占 ,这 种岩性共占气测显示段的 ,最差的凝 灰岩仅占 ,最好的岩性与最差的岩性油气显示 的厚度相差 倍 ! 可见 ,这 种不同的岩性分类基本 体现了本区火山岩的主要岩石特征 ,以及岩性对火山 岩储层油气的控制作用 。 图 不同的火山岩岩性占气测厚度的比例 火山岩岩性的分类识别方法与支持向量机分类 在使用岩石物理测井的多属性进行岩石类型识 别时 ,通常采用属性两两交会的
20、判别方法 ,这是因为 各种类型的岩石具有主要取值范围 ,如凝灰质岩层 的典型特征是高自然伽马 ( )、低体积密 度 ( );气孔杏仁玄武岩的典型特征 是低自然伽马 ( )和低体积密度 ( );致密玄武岩的分布特征是低自然伽马 ( )、高密度 ( )、低声波 时差 ( )和高电阻 ( )等特 征 ;而安山岩由于其 含量的增加 ,导致其具有高 密度 、高电阻 、高自然伽马和低中子 ( ) 特征 。 随着岩石分类数量的增加 ,各种岩石的物理响应 特征差别减小 ,就需要增加岩石物理测井属性的种类 (维数 )来减少识别的多解性 。然而 ,在处理高维属性 空间的类型识别问题时 ,传统的两两属性交会的方法
21、显然不够用了 (图 ),各种岩性在双属性的交会空间 中 ,往往具有相交甚至包含关系 ,因此很难识别 。本研 究提出了采用机器学习方法 (如 :多元回归分析 、人工 神经网络 、支持向量机 )来进行识别 。 图 不同火山岩岩性的岩石物理测井属性线性交会 根据岩石物理测井响应机理和解释方法 ,选择了 种对火山岩岩性响应敏感的测井曲线 ,即 :声波时 差 、体积密度 、光电吸收截面指数 、自然伽 马 、补偿中子 、井径 、浅电阻率 、 中电阻率 、深电阻率 、裂缝发育指数 、 密度孔隙度 、气孔孔隙度指数 、声波 孔隙度 、基于深浅电阻率差异的裂缝发育指数 、渗透率 ,作为多维地质表征参数进行火 山
22、岩岩性识别 。 石 油 学 报 年 第 卷 三种算法简介 笔者尝试采用如下 种算法 :多元回归分析 ( ,简称 ),人工神经网络 ( ,简称 ),支持向量机 ( ,简称 )。 这 种算法 ( 、 和 )使用同一已知 参数 ,要求预测的未知量也相同 ,只是计算结果不同 。 假设有 个学习样本 ,每个含有 个地质参 数 (即 , , , )的成组观察值 (即 , , , )( , , ), ,而实际应用时 远 大于 。将前 个地质参数的 个样本定义为 个向量 ,即 : ( , , )( , , ) ( ) 设 为式 ( )定义的向量的一般形式 。 、 和 这 种算法的基本思想都是试求一个 表达式
23、( ),使表达式 ( )达到极小 ,仅是实现途 径 、计算结果精度不同 。 ( ) ( ) 在数学上 ,上述的 ( , , )称为自变量 , 称为应变量 。 借助于 求出的 表达式是 个地质参数 (即 , , )的线性组合再加上一个常数项 : ( ) 式中 : , , , 是通过逐步回归分析 求出 的常数 。 借助于 求出的 表达式是关于 个地质参 数 (即 , , )的 “隐式 ”表达式 : ( , , ) ( ) 式中 : 是 非 线 性 函 数 ,可 由 误 差 反 向 传 播 模 型 算出 。这种函数不能用通常的数学公式表示 , 故称为 “隐式 ”表达式 。 是在统计学习理论基础上发展
24、起来的一种 新的机器学习方法 ,其基本实现途径是通过核函数将 实际问题 (原空间 )转换到新的高维特征空间 ,在新空 间中构造线性判别函数来代替原空间中的非线性判别 函数 。从理论上讲 ,该算法能够得到全局最优解 , 可避免 在实际应用中可能出现的局部极值问题 (这种情况较为罕见 )。 与 相比 ,其主要优 点是精度高 、计算速度快 。 笔者采用了 支持向量二分类技术 ,求出的 表达式是关于向量 的非线性表达式 : ( ) ( ) 式中 : 为拉格朗日乘子向量 , ( , , ), ; 为惩罚因子 ,约束条件为 ; ( )为辐基函数 ( , )核函 数 ; 为调整参数 , ; 为分类空间超平面
25、的偏移 , 可通过自由 (即对应于 的 ,最 终 获 得 的 模型仅依赖于这些向量 )算出 。 、 及 可由式 ( )解出 ,这是一个对偶最优化 问题 。 , ( ) ( ) 综上所述 ,上述 种算法的计算流程相同 ,即 :第 一步 ,利用 个学习样本求出计算公式 (学习过程 ),即 对应的式 ( )( );第二步 ,将这 个学习样本代入这 些对应的公式 ,就可得到各自的预测值 , , , 以检验算法的拟合度 ;第三步 ,将由式 ( )所示的 个 预测样本代入这些对应的公式 ,就可得到各自的预测 值 , , 。 ( , , )( , , ) ( ) 为了与实例一致 ,上述 和 两种算法 中的
26、都定义为单应变量 。实际上 , 软件早已 将 定义为向量 ,而目前 软件尚未将 定义为 向量 。 三种算法的应用 原始数据 将牛东油田火山岩储层岩性归类成 种 (表 ), 将 井的 、 井的 及 井的 作为研究井段 。 按 间 距 进 行 采 样 ,则 这 个 井 段 分 别 有 、 及 个样本 (表 )。每个样本包括 个 自变量 ( , , , , , , , , , , , , , , )及 个应变量 ( )。 为声波时差 ( ), ; 为体积密度 ( ), ; 为光电吸收截 面指数 ( ), ; 为自然伽马 ( ), ; 为补 偿中子 ( ), ; 为井径 ( ), ; 为浅电阻 率 (
27、 ), ; 为中电阻率 ( ), ; 为深 电阻率 ( ), ; 为裂缝发育指数 ( ),取值 为 ; 为密度孔隙度 ( ), ; 为气孔孔隙 度指数 ( ), ; 为声波孔隙度 ( ), ; 为低角度裂缝发育指数 ( ); 为 渗 透 率 ( ), 。 为火山岩岩性预测值 ,以 种岩性 代码表示 : , , , , , , , , (表 和表 )。 第 期 朱怡翔等 :火山岩岩性的支持向量机识别 表 牛东油田的火山岩岩性代码 岩性 代码 岩性 物性 油气 显示 气孔杏仁玄武岩 最好 最好 蚀变气孔杏仁玄武岩 好 好 脆裂玄武岩 裂缝发育 好 脆裂凝灰质角砾岩 有 凝灰质角砾岩 有点 气孔杏仁
28、安山岩 少量 致密玄武岩 没有 致密安山岩 没有 凝灰岩 没有 这 个井段中某些岩性代码的样本个数小于 , 故都不能单独作为学习样本 ;尤其是 井的研究 井段没有岩性代码 ,故不适宜与其他井段合起来为 学习样本 。因此 ,将 井和 井的两个井段 合起来作为学习井段 ,则有 个学习样本 (或称已 知样本 ),这样每个岩性代码的样本个数都大于 ;将 井的井段为预测井段 ,则有 个预测样本 。 预测样本中的岩性代码不是输入参数 ,仅作为与 种 算法的预测值对比之用 。 采用 、 和 共 种算法进行火山 岩岩性预测 。在学习样本中 , 是输入参数 ,记为 , 由火山岩岩性识别确定 。在预测样本中 ,无
29、输入参数 值 ,其由算法确定 。 三种算法的预测结果 使用 个学习样本 (图 和图 ),通过 、 和 求出火山岩岩性预测值 ( )与 种测 井观察值 (即 , , , , , , , , , , , , , , )的关系式 。 表 井 、 井及 井的 个井段火山岩岩性代码样本个数 , 井号 井段 样本总数 岩性代码的样本个数 代码 代码 代码 代码 代码 代码 代码 代码 代码 采用 ,计算结果是一个 “显式 ”表达式 : ( ) 式 ( )的残余方差为 ,多重相关系数为 , 说明拟合度低 。该算法还指出 ,火山岩岩性预测值 与 种测井方法的相关性由大到小依次为 : ( ), ( ), ( )
30、, ( ), ( ), ( ), ( ), ( ), ( ), ( ), ( ), ( ), ( ), ( ), ( )。 采用 ,输入层节点 个 ,输出层节点 个 , 隐层节点 个 ;输出层和隐层的 网 络 学 习 率 均 为 ;迭代次数为 。终止计算精度取为 ,计算 结果是一个 “隐式 ”表达式 : ( , , ) ( ) 式 ( )的网络全局误差为 ,说明拟合度较低 。 采用 , , ,交叉检验精度为 ,说明拟合度非常高 。自由 共 个 。 终止计算精度取为 ,计算结果是一个 “显式 ”表 达式 : ( , , ) ( ) 式中 : 是非线性函数 。这种函数可以用形如式 ( )的数学公式
31、具体表示出 ,故称为 “显式 ”表达式 ,但 因其公式太长而不必具体写出 。 将 个学习样本 (图 和图 )的自变量值分 别代入式 ( )、( )、( ),就可分别算出每一学习样本 的火山岩岩性预测值 ,以检验算法的拟合度 (表 )。 类似地 ,可得 个预测样本 (图 )的火山岩岩性预 测值及预测精度 (表 )。 如表 所示 ,采用 时预测样本错判个数为 ,相对误差绝对值为 。这 个错判样本 出现在 井预测井段的某些位置 (主要是从一种 岩性过渡到另一种岩性的交界处 )的三种岩性上 : 岩 性代码 (气孔杏仁安山岩 )有 个 ,其中预测为岩性 代码 (气孔杏仁玄武岩 )有 个 ,预测为岩性代码
32、 (脆裂玄武岩 )有 个 ,预测为岩性代码 (致密玄武 岩 )有 个 ; 岩性代码 (致密安山岩 )有 个 ,其中 预测为岩性代码 (气孔杏仁安山岩 )有 个 ,预测为 岩性代码 (致密玄武岩 )有 个 ; 岩性代码 (凝灰 石 油 学 报 年 第 卷 岩 )有 个 ,均被预测为岩性代码 (凝灰质角砾岩 )。 错判的原因主要来自于学习样本个数的不足 :用两口 井 ( 和 )的 ( )个学习样 本 ,对一口井 ( )的 个预测样本进行预测 ,学 习样本个数显得有些不足 ,但 的错判率已满足 地质学中的实际应用要求 。 图 井火山岩储层测井解释综合成果 第 期 朱怡翔等 :火山岩岩性的支持向量机识
33、别 图 井火山岩储层测井解释综合成果 表 、 和 种算法的应用比较 , 算法 拟合公式 学习样本 ( 个 ) 预测样本 (个 ) 预测不正确 的样本个数 平均相对误 差绝对值 预测不正确 的样本个数 平均相对误 差绝对值 预测量 与参数 , , 的相关性 (由大到小次序 ) 计算时间 (在 机上 ) 算法 综合评价 线性 ,显式 个 个 , , , , , , , , , , , , , , 差 非线性 ,隐式 个 个 计算不出 差 非线性 ,显式 个 个 计算不出 良 注 :相对误差绝对值 () 计算值 实测值 实测值 降维的讨论 降维是指在挖掘算法正式计算之前 ,将 (自变 量 ,也称属性
34、 )的个数尽可能减少 ,也就是使数据空间 的维数减少到尽可能的小 。其益处是 :减少数据量 ,可 提高挖掘速度 ;减少属性 ,可扩大实际应用范围 ;减少 预测样本错判率 ,可提高挖掘质量 。例如 ,采用主成分 分析法对测井输入参数进行降维 ;采用 “以 为先导降维工具 、以 为降维验证工具 ”进行降 维 , ,有一个非线性关系微弱的实例 ,可将 种测 井曲线约简为 种测井曲线 ,即 维问题降为 维问 题 。对于本实例 ,根据上述的 所得的 与 种测井方法的相关性由大到小的排序 ,可知 ( ) 与 的相关性最小 (表 ),将 删除后进行 计 算 ,发现原来的预测样本错判个数由 个 (表 )上 石
35、 油 学 报 年 第 卷 图 井火山岩储层测井解释综合成果 升为 个 ,说明降维不成功 ,其原因是本实例的非线 性关系十分强烈 。 三种算法的比较 从表 可见 ,只有 适用于本实例 ,这是由于 火山岩岩性 与 种测井曲线 ( , , )的 非线性关系十分强烈的缘故 ;至于 ,其所示的相 关性次序可作为辅助应用 。此外 ,从拟合度和预测 精度来 看 , 种算法应用于本实例的优劣次序为 : 第 期 朱怡翔等 :火山岩岩性的支持向量机识别 , , 。 结论与建议 在火山岩储层评价中 ,火山岩岩石的分类应体现 不同类型的岩石对储层的控制作用 。通过综合考虑岩 石的岩性 、组构 、成因和孔隙结构等诸多因
36、素 ,将牛东 油田火山岩油藏的岩石分成了 种类型 ,即 :气孔杏仁 玄武岩 、蚀变气孔杏仁玄武岩 、脆裂玄武岩 、脆裂凝灰 质角砾岩 、凝灰质角砾 (熔 )岩 、气孔杏仁安山岩 、致密 玄武岩 、致密安山岩 、凝灰岩 。通过岩屑气测录井统计 显示 ,前 种岩性占油气显示井段厚度的 ,而最 好的岩性 (气孔杏仁玄武岩 )油气显示的厚度是最差岩 性 (凝灰岩 )厚度的 倍 ,因此 ,这样的岩石分类体现 出不同岩性对储层含油气性的控制作用 。 在样本井岩石合理分类的基础上 ,需要建立相应 的岩石物理测井解释模型进行岩性识别 。本次研究表 明 ,对于复杂的火山岩岩性的识别 ,需要采用高维岩石 物理测井
37、属性 (本次研究用 种 )进行分类识别 ,对这 样大而复杂的信息量的处理 ,是常规的 维线性分类 识别方法难以处理的 ,而采用支持向量机具有优势 ,获 得高符合率 。 当描述一个研究目标与多个相关地质因素的复杂 关系时 ,应采用非线性算法 ( 或 ),而 可作为辅助应用 ;如果这种复杂关系的非线性关系不 十分强烈 ,采用 和 预测效果几乎是同等优 越 ,当然 ,相比之下 最理想 ,且计算速度比 快 倍以上 ;反之 ,若非线性关系强烈 ,应采用 。 种算法的计算结果对比 ,发现只有 适用于本实 例 ,这是由于火山岩岩性与 种岩石物理测井参数的 非线性关系十分强烈的缘故 。 参 考 文 献 范宜仁
38、 ,黄隆基 ,代诗华 交会图技术在火山岩岩性与裂缝识别 中的应用 测井技术 ,(): , , , , , ( ): , 王拥军 ,周雪峰 ,吴海忠 ,等 火山岩岩性识别新技术 断块油 气田 ,(): , , , , , ( ): 赵新建 ,胡刚 ,张梦宁 ,等 火山岩岩性识别方法研究 国外测 井技术 ,(): , , , , , , ( ): , 刘传平 ,郑建东 ,杨景强 徐深气田深层火山岩测井岩性识别方 法 石油学报 ,(增刊 ): , , , , ( ): 于代国 ,孙建孟 ,王焕增 ,等 测井识别岩性新方法 支持向量 机方法 大庆石油地质与开发 ,(): , , , : , , ( )
39、: 李新虎 基于不同测井曲线参数集的支持向量机岩性识别对比 煤田地质与勘探 , , ( ): , , , ( ): , 马海 ,王延江 ,胡睿 ,等 测井岩性识别新方法研究 地球物理 学进展 ,(): , , , , , ( ): 文政 ,高松洋 ,毕广武 支持向量机在复杂岩性测井识别中的应 用 大庆石油地质与开发 ,(): , , ( ) , , ( ): 钟仪华 ,李榕 基于主成分分析的最小二乘支持向量机岩性识别 方法 测井技术 ,(): , , , ( ): 程国建 ,郭瑞华 分类模型在岩性识别中的应用 西安石油大学学报 :自然科学版 , , ( ): , : , , ( ): 张莹 ,
40、潘保芝 支持向量机与微电阻率成像测井识别火山岩岩性 物探与化探 , , ( ): , , , , ( ): , ( ) , , ( ): 邱家骧 国际地科联火成岩分类学分委会推荐的火山岩分类简 介 现代地质 ,(): , , ( ): 石 油 学 报 年 第 卷 , , , , 雍世和 ,洪有密 测井资料综合解释与数字处理 北京 :石油 工业出版社 ,: , : , : 石广仁 ,张光亚 ,石骁騑 多地质因素的勘探目标优选 人工神 经网络法与多元回归分析法比较研究 石油学报 ,(): , , : , , ( ): , , , : , , ( ): 石广仁 地学数据挖掘与知识发现 北京 :石油工
41、业出版社 , : : , : , , ( ): 统计学习理论的本质 张学工 ,译 北京 :清华 大学出版社 ,: : , : , 支持向量机导论 李国正 ,王 猛 ,曾华军 ,译 北京 :电子工业出版社 ,: , , , : , : , , , , , ( ): 石广仁 支持向量机在多地质因素分析中的应用 石油学报 , , ( ): , , ( ): 李洪奇 ,郭海峰 ,郭海敏 ,等 复杂储层测井评价数据挖掘方法研 究 石油学报 ,(): , , , , , ( ): , , ( ): 石广仁 数据挖掘在石油勘探数据库中的应用前景 中国石 油勘探 ,(): , , ( ): (收稿日期 改回日期 责任编辑 熊 英 )