收藏 分享(赏)

基于质量规则矿政属性数据评价.pdf

上传人:weiwoduzun 文档编号:1761722 上传时间:2018-08-22 格式:PDF 页数:4 大小:283.08KB
下载 相关 举报
基于质量规则矿政属性数据评价.pdf_第1页
第1页 / 共4页
基于质量规则矿政属性数据评价.pdf_第2页
第2页 / 共4页
基于质量规则矿政属性数据评价.pdf_第3页
第3页 / 共4页
基于质量规则矿政属性数据评价.pdf_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

1、第28卷第6期 2014年12月 黑龙江工程学院学报 Journal of Heilongj iang Institute of Technology Vo128。No6 Dec,2014 基于质量规则矿政属性数据评价 朱巧玉 (中国矿业大学环境与测绘学院,江苏徐州221116) 摘要:矿政属性数据质量直接关系到矿政总体数据质量以及系统功能的发挥。由于缺乏完整的矿政属性数据定 量评价过程,选择准确性、完整性、一致性、现势性4个维度作为数据质量维度指标体系,并针对每个维度指标给出 相应的规则约束来定量化描述质量问题,然后利用加权平均分和缺陷扣分法相结合的评价方法,结合某个矿区的储 量管理属性数据

2、进行实例分析,分析结果表明该矿区储量数据质量有待提高。 关键词:矿政管理;数据质量;规则约束;灰色评价法 中图分类号:P208 文献标志码:A 文章编号:16714679(2014)06-001304 Evaluation of mining property data based on quality rules ZHU Qiaoyu (School of Environment Science and Spatial Informatics,China University of Mining and Technology,Xuzhou 221116,China) Abstract:The

3、 quality of the source data in mining administration influnces directly the whole and the systematic fumctionFour dimensions:accuracy,completeness,consistency,timeliness are regarded as the index systemThe weighted average point method and defect evaluation method are proposed with examples to get t

4、he quality evaluation value of basic geological dataThe evaluation results indicate that the data quality of rating is not reached,and the quality of data based on geological data needs to be improved Key words:mining administration;data quality;rules constraint;grey evaluation 在过去的10 a里,国家开展“金土工程”、

5、全国 二次土地调查、土地规划修编、矿业权实地核查等 工作,目的在于掌握真实的土地基础数据,建立“一 张图”为基础的核心数据库,实现国土资源信息化、 网络化管理,建立覆盖国家、省、市、县级国土资源 政务管理信息化系统。在这个过程中,一方面由于 GPS、传感器、终端等实时产生的数据导致矿政数据 的激增,产生巨量性、快变性、不确定性、不一致性 的数据;另一方面由于国土资源信息化过程中存在 数据来源分散、数据逻辑错误、数据冗余、保存方法 落后以及数据存储方式不同的现象,这些都会影响 数据质量,降低数据库的质量、可信度和可使用性, 影响矿政管理核心数据库的建设,继而影响矿政管 理系统功能的发挥以及决策的

6、正确性。 数据质量没有一个绝对明确的概念,在不同领 收稿日期:20140504 作者简介:朱巧玉(1988一),女,硕士研究生,研究方向:地理信息系 统开发与应用;空间分析及空间数据质量 域、不同需求分析、不同的时期,其内涵和标准是不 同的。传统的数据质量要素包括完整性、准确性、 一致性等维度,这些维度指标太抽象,无法进行定 量化的度量。文献1基于简单随机抽样和分层抽 样的属性数据缺陷率度量数学模型,对土地利用属 性数据进行抽样检查,侧重于抽样方法的研究,没 有给出具体的数据质量维度。文献Ee对空间数据 质量问题的研究现状作了简要介绍,提出数据质量 控制策略。文献3定义了基于七项指标的十五类

7、数据质量约束规则,没有给出具体的评价过程以及 评价结果。文献4基于知识与规则库开发地籍数 据质量检查系统,仅对地籍数据的完整性进行检 查。文献5基于用户期望和业务规则对数据质量 进行验证,没有对数据质量进行评价。文献6从 用户的角度给出数据质量维度指标以及数据质量 评价模型,并利用通信系统验证数据质量。文献 7在分析通常的土地数据错误类型的基础上,提 出建立元数据库和质量规则实施数据检查的方法, 14 黑龙江工程学院学报 第28卷 没有从数据质量包含的定量元素进行考虑。可见 针对不同的领域,从不同角度出发,数据质量维度 指标和质量规则取舍与制定是不同的。本文选择 准确性、完整性、一致性、现势性

8、等4个维度作为数 据质量维度指标体系,针对每个维度指标给出相应 的规则约束定量化描述质量问题,然后采用加权平 均和缺陷扣分法相结合的评价方法,并给出具体的 应用实例。 1数据质量概述 数据质量被认为是独立于数据生产和使用环 节的数据本身的概念,可以从数据生产者、管理者、 用户的满意度或从系统结构的角度对其进行阐述, 目前还没有一个统一的定义。数据质量元素包括 定量元素和非定量元素。其中,定量元素包括完整 性、准确性、一致性、现势性等E 。 数据质量的好坏直接影响到利用该数据得到的决 策,因此,对数据质量进行评价是十分必要的。数据质 量评价是一个复杂的过程,如图1所示。 1)首先确定待评估数据的

9、一个可行范围。 2)分析数据,选择数据质量维度。通过考察数 据模式以及数据表达形式,对数据有一个完整的理 解,然后选择待评估的维度指标。 3)根据需求分析以及期望得到的评估结果,制 定维度指标的评估规则。对于每一个维度指标来 说,可以用一条或多条约束规则对其进行量化。 4)利用定量化的方法对数据质量进行评价。 5)对评价结果进行分析。 图1数据质量评价过程 2 应用实例 由于鄂尔多斯市矿政数据库中数据量非常大,包 括储量管理数据、矿产资源开发利用现状调查数据、 地质环境质量数据、单矿业权数据、基础地理数据、采 矿权数据、探矿权数据等多个类别。每个类别在数据 库中所占比例不一样,要对矿政总体数据

10、进行质量评 价,可以分别对每一类数据进行质量评价,然后将各 类数据质量得分隋况加权,最终得到矿政总体数据的 质量情况。本文以该市的万利川煤矿的储量管理属 性数据为例进行质量评估。 21确定数据集 该矿区储量管理数据包括Access数据库、储量 核查报告,其中Acess数据库包含探矿权、矿体、采空 区、核查块段、核查块段储量、储量利用、采矿权三率 等21个表,储量核查报告包括采矿权属性表、核查矿 区属性表、煤层储量分割估算统计表等8张附表和备 案证明、编制单位承诺书、采矿证等7个附件。 22确定维度 传统的数据文献都是把数据质量定量元素作 为评价指标,例如文献E9把完整性、逻辑一致性、 位置准确

11、性、时间准确性、属性准确度、附件质量作 为数据质量维度指标;文献1O从精度、逻辑一致 性、数据完整性进行数据评价;文献El1把完整性、 逻辑一致性、位置精度、时间精度、专题属性精度作 为数据质量维度指标。针对数据来源多样、表现形 式多样以及比例尺多样化的问题,根据维度指标选 择的原则,如指标数据量不宜过大、层次不宜过多, 本文选取准确性、完整性、一致性和现势性作为数 据质量维度指标,如图2所示。准确性描述真实值 与实际录入值之间的偏离程度,数据的准确性表现 在数据内容和数据格式上,即数据的值域范围以及 第6期 朱巧玉:基于质量规则矿政属性数据评价 格式,如储量报表中不同矿种的开采量、损失量是

12、否符合其实际的真值,其值域范围是否恰当。完整 性描述要素数据、数据属性以及数据关系是否存在 多余或缺失,如矿产资源开发利用现状中数据表、 数据类型、注记及文档的多余或缺失。一致性描述 数据对规定的数据结构、属性及逻辑关系规则的符 合程度,包括概念一致性、值域一致性、格式一致性 等,如不同来源的探矿权中的要素代码、许可证号、 项目类型等的编码、类型和长度要一致,否则就会 违反数据的唯一性。现势性是指数据的时间精度, 即所有的数据要满足一定时间期限,否则数据是无 效的。如搜集来的矿产资源开发利用现状调查数 据必须在E2oo8,2014范围内,不在这个范围内的 数据是没有意义的。 一级 指标 二级

13、指标 图2数据质量维度指标体系 23制定评估规则 根据数据质量规则的内涵以及储量管理数据 的特点,制定4个维度指标对应的质量评估规则,如 表1所示。 表1维度指标规则化 24数据质量评价方法 加权平均法和缺陷扣分法相结合的评价方法 能够体现不同要素层或者同一要素层错误数据对 数据总体质量结果产生的影响程度不同,比较符合 实际情况。评价结果引用陕西省第二次土地调查 城镇地籍数据库质量评价研究,公式表示为 DQE(100一 JYk z)。W 11 式中:DQ表示数据质量结果, 为第i中指标的权 重,z为评价指标的总数,z为各项指标单位产品中严 黑龙江工程学院学报 第28卷 重缺陷的分值(严重缺陷指

14、待评价对象及重要质量指 标不符合规则要求,导致用户无法使用,缺陷值为42 分),Y为各项指标单位产品中重缺陷的分值(重缺陷 指待评价对象的重要质量指标不符合要求,对用户使 用产生重大影响,缺陷值为12分),Z为各项指标单 位产品中轻缺陷的分值(轻缺陷指评价对象的一般质 量指标不符合要求,对用户使用产生轻微影响,缺陷 值为1分),J为各项指标单位产品中严重缺陷的个 数, 为各项指标单位产品中重缺陷的个数,z为各项 指标单位产品中轻缺陷的个数12-14。 根据表1中的数据质量规则对万利川煤矿的储 量管理属性数据的2l张表格、8个附表以及7个附 件进行检查,得到该煤矿储量管理属性数据的缺陷 情况。其

15、权重采用专家定权的方法,由有经验的专 家给出数据评价指标权重,如表2所示。 表2万利川煤矿的储量管理属性数据质量评分 25结果分析 由式(1)计算可得万利川煤矿的储量管理属性 数据质量得分值为726分。根据质量评分等级 90100分,数据质量等级为优;8089分,数据质 量等级为良;7079分,数据质量等级为中;60 69分,数据质量等级为合格;小于60分,数据质量 等级为不合格。可知,万利川煤矿的储量管理属性 数据质量为726分,质量等级为中。所属等级还没 达到良,这说明该数据质量有待提高,否则会影响 矿政管理中的核心数据库的质量,继而影响整个矿 政管理系统的功能发挥。在数据收集、录入的过程

16、 中,应该从数据清洗、检测重复对象、缺失数据处理 等几个方面对数据进行预处理,提高数据质量。 3 结 论 1)基于领域知识和规则对矿政属性数据进行 定量化描述,细化评价的规则,有利于数据质量评 价的实施。 2)矿政属性数据量大,由很多不同类别的数据 组成。对矿政总体数据进行质量评价,可以对不同 的数据类别分别进行数据质量评价,然后根据不同 类别数据的权重进行加权计算,得到总体数据的质 量评价结果。 3)采用基于质量规则和灰色理论的方法对矿 政数据进行质量评价,有助于数据人库人员知道数 据质量的高低,进而找出数据质量存在问题的原 因,采取相应的措施提高矿政数据质量,这将有利 于提高矿政管理系统的

17、信息化水平,增强系统决策 的正确性。 参考文献 1刘春,史文中,刘大杰数字土地信息中属性数据的质量 控制J武汉大学学报:信息科学版,2004(1):244248 2刘大杰,刘春GIS空间数据不确定性与质量控制的研 究现状J测绘工程,2001(1):6-10 3袁满,张雪一种基于规则的数据质量评价模型EJ计算 机技术与发展,2013(3):81-84 I-4吴长彬,闾国年,舒飞跃基于知识与规则的地籍数据质 量检查方法I-j-i地理与地理信息科学,2007(5):2225 1,5DAVID LOSHINRule-Based Data Quality-AIn CIKM 02:Proceedings

18、of the eleventh international conference on Information and knowledge management,2002: 614616 I-6赵军喜,孙庆辉,张亚军地理空间元数据理论体系研究 l-J测绘工程,2014,23(4):1013 7方利,刘生权,钟耳顺基于元数据和质量规则的土地数 据检查I-J地球信息科学,2004(3):1923 83王超晖城市基础地理信息系统的数据质量控制研究 D江西:江西理工大学,2009 9胡小静空间数据质量控制与评价方法研究D昆明: 昆明理工大学,2011 -10关海鹰属性数据的质量问题探讨D山东:山东科技 大学,2004 1-11钟赞国土详查内外业一体化数据质量控制体系研究 D成都:西南交通大学,2010 1-12周熠,肖强,赵国成,等基础地理空间数据持续更新模 式分析I-j测绘工程,2014,23(1):1216 13徐少坤,宋国民,王海葳,等地理空间元数据可视化设 计及关键技术研究J测绘工程,2014,23(4):4550 14曹佳陕西省第二次土地调查城镇地籍数据库质量评 价研究D西安:长安大学,2011 责任编辑:郝丽英

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报