R语言数据挖掘2.1.2.1 关联规则
2.1.2.1 关联规则 关联分析可以从海量数据集中发现有意义的关系,这种关系可以表示成关联规则的形式或频繁项集的形式。具体的关联分析算法将在后面一个章节中给出。 关联规则挖掘旨在发现给定数据集(事务数据集或其他序列-模式-类型数据集)中的结果规则集合。给定预先定义的最小支持度计数s和置信度c,给定已发现的规则X→Y support_count (X→Y)≥s且confidence (X→Y).....
R语言数据挖掘2.1.1.2 频繁子序列
2.1.1.2 频繁子序列 频繁子序列是元素的一个有序列表,其中每个元素包含至少一个事件。一个例子是某网站页面访问序列,具体而言,它是某个用户访问不同网页的顺序。下面给出了频繁子序列的两个例子。 消费者数据:某些客户在购物商城连续的购物记录可作为序列,购买的每个商品作为事件项,用户一次购买的所有项作为元素或事务。 网页使用数据:访问WWW历史记录的用户可作为一个序列,每个UI/页面作为一个事件.....
R语言数据挖掘2.1.1.1 频繁项集
2.1.1.1 频繁项集 频繁项集的概念来源于真实的购物篮分析。在诸如亚马逊等商店中,存在很多的订单或交易数据。当客户进行交易时,亚马逊的购物车中就会包含一些项。商店店主可以通过分析这些大量的购物事务数据,发现顾客经常购买的商品组合。据此,可以简单地定义零个或多个项的组合为项集。 我们把一项交易称为一个购物篮,任何购物篮都有组元素。将变量s设置为支持阈值,我们可以将它和一组元素在所有的购物篮中.....
R语言数据挖掘2.1 关联规则和关联模式概述
2.1 关联规则和关联模式概述 数据挖掘的一个最受欢迎的任务就是发现源数据集之间的关系,它从不同的数据源(如购物篮数据、图数据或流数据)中发现频繁模式。 为了充分理解关联规则分析的目的,本章中所有算法均用R语言编写,这些代码使用算法的标准R添加包(如arules添加包)进行说明。
R语言数据挖掘第2章 频繁模式、关联规则和相关规则挖掘
第2章 频繁模式、关联规则和相关规则挖掘 本章中,我们将首先学习如何用R语言挖掘频繁模式、关联规则及相关规则。然后,我们将使用基准数据评估所有这些方法以便确定频繁模式和规则的兴趣度。本章内容主要涵盖以下几个主题: 关联规则和关联模式概述 购物篮分析 混合关联规则挖掘 序列数据挖掘 高性能算法 关联规则挖掘算法可以从多种数据类型中发现频繁项集,包括数值数据和分类数据。根据不同的适用环境,关联规...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。