文章 2017-09-01 来自:开发者社区

中国人工智能学会通讯——一种基于众包的交互式数据修复方法 6 结束语

6 结束语 在本文提出的交互式修复方法CrowdAidRepair,通过众包提高了已有的基于规则的修复方法的修复质量。大量的实验数据显示,该方法生成的交互方案可以平均减少60%的成本,并且达到了和单纯依赖于众包修复几乎一样高的修复质量。在未来的工作中,我们可能会考虑将该方法与其他先进的基于模型的方法进行结合,并将其应用到既有数据错误也有数据丢失的数据集中。 本研究获得中国国家自然科学基金 ( 项....

文章 2017-09-01 来自:开发者社区

中国人工智能学会通讯——一种基于众包的交互式数据修复方法 5 相关工作

5 相关工作 数据修复旨在发现和修正数据库中错误的数据。在过去的几十年里,研究人员提出了各种各样自动发现并修复数据库中错误数据的方法[1]。这些方法大致可以分为如下三类。 (1)传统的方法先依赖各种约束条件,包括FDs[5,7]、CFDs[6]、完整性约束[4]和包含关系(INCs)[5]来检测数据中的由错误数据引起的不一致性(或冲突);然后用文献[2-4]中的方法修正所有的错误数据,从而解决所....

文章 2017-09-01 来自:开发者社区

中国人工智能学会通讯——一种基于众包的交互式数据修复方法 3 给定质量约束下的交互式算法

3 给定质量约束下的交互式算法 为了生成一个有效的交互式方案,我们提出了自己的算法,其中的关键问题是在众包修复过程中如何选择被众包修复的值。 首先,我们倾向于选择引起数据冲突最多的值进行众包修复,这样就会有更多的值在下一步的基于规则的修复过程中可以被推导。为了找出引起数据间冲突最多的值,先评估每个值的不和谐度disharmonious degree(简称为dScore),表示这个值和数据集中其他....

文章 2017-09-01 来自:开发者社区

中国人工智能学会通讯——一种基于众包的交互式数据修复方法 2 前期工作和问题陈述

2 前期工作和问题陈述 2.1 基于规则的修复方法 定义1一个集合被定义为正确集合当且仅当集合中所有的值均正确。如果这两个集合不可以同时都是正确集合,我们说这两个集合之间存在冲突(Conflict)。 基于规则的修复方法依赖预定义的质量规则检测数据之间的冲突,并希望通过清洗引起冲突的错误达到解决这些冲突的目的。本文以FD/CFD为例来展示我们的方法是如何执行的。为了便于理解,给出一个运行示例。 ....

中国人工智能学会通讯——一种基于众包的交互式数据修复方法  2 前期工作和问题陈述

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐