1、软件工程专业优秀论文 基于规则的数据质量管理系统架构与关键问题研究关键词:电子政务 数据质量 数据修复 数据结构摘要:最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构
2、建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为 qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到 xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的SQL 语句并执行以检索违例数据;
3、对于 xml 类型的数据源,我们最终将该逆表达式转换为 XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。正文内容最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则
4、的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为 qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到 xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部
5、分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的SQL 语句并执行以检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为 XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构
6、采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能
7、够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填
8、充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的
9、数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以
10、检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于
11、规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部
12、分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构
13、采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能
14、够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填
15、充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的
16、数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以
17、检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于
18、规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部
19、分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构
20、采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能
21、够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填
22、充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的
23、数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以
24、检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。最近一些年来,数据质量问题受到了越来越多的关注,很多企业和政府机构采用各种力所能及的管理和技术手段来提高数据质量从而提高其数据资产的价值。但学术界对数据质量的系统研究仍显薄弱,用于提高数据质量的软件系统也较少并且功能较为局限。 本文所设计的被称为 RDQMS 的基于
25、规则的数据质量管理系统具有自动信息收集、根据规则自动诊断和进行自动填充和修复的能力。它能够被用于持续的发现实例层面的数据质量问题并及时进行修订,具有较好的实用性和智能性。论文对数据质量管理系统中涉及的数据质量规则库构建、数据质量诊断和数据修复三个关键技术问题进行了详细的分析。受遗传编程技术的启发,提出了一种采用树型结构来描述所有规则的新方法,并将其称为qET。所有规则采用 xml 方式存储,从而能够直接将 qET 不加改变的映射到xml 文件中。同时,我们还提出了几个简单实用的新算法用于自动从样本数据集中发现规则,这几个算法非常适合从存储大量数据的关系数据库中发现函数依赖规则。在数据质量诊断部
26、分,讨论了基于 qET 的数据质量诊断算法。在该算法中,我们先将一个 qET 表达式转换为其逆表达式;对于关系型数据源,我们将该逆表达式最终转换为能在关系型数据源中检索异常数据的 SQL 语句并执行以检索违例数据;对于 xml 类型的数据源,我们最终将该逆表达式转换为XQuery 语句并执行以检索违例数据。对于异常和空的数据元素进行自动修复是一个较为复杂的问题。重点讨论了基于规则的数据自动修复和填充算法。在该算法中,我们直接运用 qET 表达的质量规则进行空值填充和异常数据修复。基于 qET 的强大表达力,算法具有很好的实用性。特别提醒 :正文内容由 PDF 文件转码生成,如您电脑未有相应转换
27、码,则无法显示正文内容,请您下载相应软件,下载地址为 http:/ 。如还不能显示,可以联系我 q q 1627550258 ,提供原格式文档。我们还可提供代笔服务,价格优惠,服务周到,包您通过。“垐垯櫃 换烫梯葺铑?endstreamendobj2x 滌甸?*U 躆 跦?l, 墀 VGi?o 嫅#4K 錶 c#x 刔 彟 2Z 皙笜?D 剧珞 H 鏋 Kx 時 k,褝仆? 稀?i 攸闥-) 荮vJ 釔絓|?殢 D 蘰厣?籶(柶胊?07 姻Rl 遜 ee 醳 B?苒?甊袝 t 弟l?%G 趓毘 N 蒖與叚繜羇坯嵎憛?U?Xd* 蛥?-.臟兄+鮶 m4嵸/E 厤U 閄 r塎偨匰忓tQL 綹 eb?抔搉 ok 怊 J?l?庮 蔘?唍*舶裤爞 K 誵Xr 蛈翏磾寚缳 nE 駔殞梕 壦 e 櫫蹴友搇6 碪近躍邀 8 顪?zFi?U 钮 嬧撯暼坻7/?W?3RQ 碚螅 T 憚磴炬 B- 垥 n 國 0fw 丮“eI?a揦(?7 鳁?H?弋睟栴?霽 N 濎嬄! 盯 鼴蝔 4sxr?溣?檝皞咃 hi#?攊(?v 擗谂馿鏤刊 x 偨棆鯍抰Lyy|y 箲丽膈淢 m7 汍衂法瀶?鴫 C?Q 貖 澔?wC(?9m.Ek?腅僼碓 靔 奲?D| 疑維 d袣箈 Q| 榉慓採紤婏(鞄-h-蜪7I冑?匨+蘮.-懸 6 鶚?蚧?铒鷈?叛牪?蹾 rR?*t? 檸?籕