模式识别与人工智能
2025年4月13日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (5): 835-844    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
数据质量检测规则挖掘方法
刘波,耿寅融
暨南大学信息科学技术学院计算机科学系广州510632
Mining Method for Data Quality Detection Rules
LIU Bo, GENG Yin-Rong
Department of Computer Science,College of Information Science and Technology,Jinan University,Guangzhou 510632

全文: PDF (434 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 数据质量规则是检测数据库质量的关键。为从关系数据库中自动发现数据质量规则,并以其为依据检测错误数据,研究质量规则表示形式及其评估度量,提出以数据项分组及其可信度为依据的最小质量规则计算准则、挖掘算法以及采用质量规则检测错误数据的思路。该数据质量规则形式借鉴关联规则的可信度评估机制、条件函数依赖的表达能力,统一描述函数依赖、条件函数依赖、关联规则等,具有简洁、客观、全面、检测异常数据准确等特性。与相关研究相比,降低挖掘算法的时间复杂度,提高检错率。用实验证明该方法的有效性和正确性。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘波
耿寅融
关键词 数据质量规则检测挖掘数据项分组    
Abstract:Data quality rules are key to the database quality detection. To discover data quality rules from relational databases automatically and detect the error or abnormal data based on them, the form and evaluation measures of data quality rules are studied, and criterions of computing data quality rules are presented based on data item groups and the confidence threshold. The algorithms of mining minimal data quality rules and the main idea of detecting data errors using data quality rules are also given. The new form of data quality rules makes use of confidence mechanism of association rules and the expression of conditional functional dependencies to describe functional dependencies, conditional functional dependencies and association rules in the same format. It can be concluded that this kind of data quality rules has the properties of conciseness, objectivity, completeness and accuracy of detecting the error or abnormal data. Compared with other related research work, the proposed algorithms have lower temporal complexity, and the discovered quality rules improve the detecting rate. The effectiveness and correctness of the proposed methods are proved by the experiments.
Key wordsData Quality Rule    Detection    Mining    Data Item Group   
收稿日期: 2011-04-25     
ZTFLH: TP301  
基金资助:国家自然科学基金项目(No.61003056)、广东省自然科学基金项目(No.S2012010008831)、广东省科技攻关项目(No.2010B010600026)资助
作者简介: 刘波,女,1965年生,副教授,主要研究方向为信息集成、数据挖掘、人工智能。E-mail:ddxllb@163。com。耿寅融,女,1986年生,硕士研究生,主要研究方向为信息集成、数据挖掘。
引用本文:   
刘波,耿寅融. 数据质量检测规则挖掘方法[J]. 模式识别与人工智能, 2012, 25(5): 835-844. LIU Bo, GENG Yin-Rong. Mining Method for Data Quality Detection Rules. , 2012, 25(5): 835-844.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I5/835
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn