文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——12.44 分类型数据的定义

12.44 分类型数据的定义 设 X={x 1 , x 2 , …, x n } 表示 n 个对象组成的一个数据集,其中 x i =(x i1 , x i2 , …, x im ) 表示由 m 个属性A={a 1 , a 2 , …, a m } 描述的第 i 个对象、x ij (1 ≤ j ≤ m)表示对象 x i 在第 j 个属性上的取值。表示对象集 X 在第 j 个属性上的值域。对于任意的....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——6.10 链接数据实践

6.10 链接数据实践 从语义网的理想被提出起,人们就不断尝试各种建立数据之间链接的技术和方法。比较典型的如LOD(Linked Open Data Project) [17] 、Schema.org [18] 、WikiData [19] 等。 LODLOD 的初衷是为了实现 Tim Berners-Lee 在2006 年发表的有关链接数据(Linked Data)作为语义网的一种实现的设想[....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——12.43 分类型数据聚类算法研究进展

12.43 分类型数据聚类算法研究进展 在大数据环境下,许多数据是缺乏先验信息的,对数据标注的成本也越来越高,一个最自然的方法是对数据进行适当划分之后再进行相关的数据处理,而聚类分析是数据划分的一种重要技术手段[1] 。在许多实际应用中,分类型变量是一种非常重要的数据表现形式[2] 。比如,在问卷调查中,客户的兴趣爱好、家庭住址、教育情况都是分类型变量;在电子邮件过滤中,将邮件分为垃圾邮件和合法....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——12.26 基于众包的数据提纯

12.26 基于众包的数据提纯 随着基于位置服务的蓬勃发展 , 随之出现了大量相关的空间文本数据。空间文本数据包括两方面信息,一个空间位置信息 , 通常与一个空间兴趣点相关,由一个经纬度坐标点表示数据所处的地理位置;一个文本信息,通常是由一组关键词构成的类似标签的文本描述。目前,这些关键词标签的生成方式主要通过人工添加与机器算法自动生成,由于来源广泛,这些生成的关键词质量参差不齐,很多质量难以保....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——11.75 复杂数据融合与高效学习

11.75 复杂数据融合与高效学习 在实际应用中,往往存在多种类型的数据,如符号型、数值型、集值型和缺失数据等。粗糙集作为数据建模与规则提取的重要方法之一,已经取得了长足的进步,而其优点在于无需利用先验知识就可以进行知识发现。但是,在面临复杂数据时,往往不能很好地进行数据融合。而且,当复杂数据同时又高维、海量时,与其他建模方法一样,拥有时间消耗过长的缺点,乃至无法处理。为解决此类问题,我们引入了....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——4.28 数据挖掘技术在电子数据取证中的应用

4.28 数据挖掘技术在电子数据取证中的应用 电子数据取证过程中会获得大量的证据数据,主要来源于三个方面,一是计算机主机系统方面的证据,主要包括来自硬盘、内存、外设中的数据;二是来自网络方面的证据,主要包括实时获取的网络通信数据流网络设备上产生的记录,以及网络安全设备上的日志和登录日志;三是来自其他数字设备的证据,如手机、手持电子设备。这些可疑数据的数据量非常庞大并且不断更新,面对这样庞大的、变....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——4.27 电子数据取证理论与技术

4.27 电子数据取证理论与技术 电子数据取证的概念 电子数据取证是指恢复已被破坏的计算机数据及提供相关的电子数据证据。利用计算机软硬件技术,以符合法律规范的方式对计算机入侵、破坏、欺诈、攻击等违法犯罪行为进行证据获取、保存、分析和出示的过程。 电子数据取证理论与技术 电子数据取证技术是伴随着计算机技术、网络技术、信息安全技术发展而快速发展的一个新兴领域,近年来取得了许多重大成就,然而从电子数据....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——4.26 电子数据证据

4.26 电子数据证据 电子数据证据的概念 在介绍电子数据证据的概念之前,首先介绍电子数据的概念。电子数据是指基于计算机应用、通信和现代管理技术等电子化技术手段形成包括文字、图形符号、数字、字母等的客观资料,包括电子邮件、电子数据交换、网上聊天记录、博客、微博客、手机短信、电子签名、域名等。 电子数据证据也称为计算机证据、计算机数据证据、电子文件证据等[1-3] ,一般是指在涉及计算机违法犯罪过....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——8.37 文献数据获取

8.37 文献数据获取 本文从多个维度获取在软件工程领域与演化算法有关的研究成果。首先,从基于搜索的软件工程文献仓库(SBSE Repository)获取基于搜索的软件工程的文献列表。本文选取该仓库中 1 502篇发表在期刊或者会议上的文章(删除书籍、技术报告等类型的文献),将这些文章的标题、摘要、发表刊物、发表时间以及作者等信息从 SBSERepository 网站提取下来。第二,提取所有文献....

文章 2017-09-04 来自:开发者社区

《中国人工智能学会通讯》——7.6 数 据

7.6 数 据 在应用以上深度学习模型的过程中,一个比较棘手的问题是随着网络变得越来越复杂,其表示能力也越来越强,其中的参数也越来越多,由此带来的问题是如果训练数据规模不够大,则很容易使模型陷入过拟合的状态。 传统利用语言学专家进行数据标注的方法需要花费大量的人力、物力、财力,存在标注代价高、规范性差等问题,很难获得大规模高质量的人工标注数据。为了解决数据获取的难题,比较直接的是利用众包的方式获....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐