R语言数据挖掘2.4.1 序列数据集

2.4.1 序列数据集        序列数据集S定义为元组(sid, s)的集合,其中sid为序列ID,s为序列。 在序列数据集S中,序列X的支持度定义为S中包含X的元组数,即 supportS(X)={(sid, s)∨(si...

R语言数据挖掘2.2.5 基于最大频繁项集的GenMax算法

2.2.5 基于最大频繁项集的GenMax算法 GenMax算法用来挖掘最大频繁项集(Maximal Frequent Itemset,MFI)。算法应用了最大性特性,即增加多步来检查最大频繁项集而不只是频繁项集。这部分基于Eclat算法的事物编号集合交集运算。差集用于快速频繁检验。它是两个对应项目...

大数据之R语言速成与实战

30 课时 |
18022 人已学 |
免费
开发者课程背景图

R语言数据挖掘2.2.4.2 FP-growth算法

2.2.4.2 FP-growth算法 这里是递归定义的伪代码,其输入值为:R←GenerateFPTree(D), P← , F←  

R语言数据挖掘2.2.4.3 R语言实现

2.2.4.3 R语言实现 FP-growth算法的主要部分的R语言实现代码如下所示。  

R语言数据挖掘2.2.2.4 Apriori算法的变体

2.2.2.4 Apriori算法的变体 为提升Apriori算法的效率和可扩展性,人们提出了Apriori算法的一些变体。下面介绍几种比较代表性的Apriori改进算法。

R语言数据挖掘2.1.2.1 关联规则

2.1.2.1 关联规则 关联分析可以从海量数据集中发现有意义的关系,这种关系可以表示成关联规则的形式或频繁项集的形式。具体的关联分析算法将在后面一个章节中给出。 关联规则挖掘旨在发现给定数据集(事务数据集或其他序列-模式-类型数据集)中的结果规则集合。给定预先定义的最小支持度计数s和置信度c,给定...

R语言数据挖掘2.1.1.2 频繁子序列

2.1.1.2 频繁子序列 频繁子序列是元素的一个有序列表,其中每个元素包含至少一个事件。一个例子是某网站页面访问序列,具体而言,它是某个用户访问不同网页的顺序。下面给出了频繁子序列的两个例子。 消费者数据:某些客户在购物商城连续的购物记录可作为序列,购买的每个商品作为事件项,用户一次购买的所有项作...

R语言数据挖掘2.1.1.1 频繁项集

2.1.1.1 频繁项集 频繁项集的概念来源于真实的购物篮分析。在诸如亚马逊等商店中,存在很多的订单或交易数据。当客户进行交易时,亚马逊的购物车中就会包含一些项。商店店主可以通过分析这些大量的购物事务数据,发现顾客经常购买的商品组合。据此,可以简单地定义零个或多个项的组合为项集。 我们把一项交易称为...

R语言数据挖掘2.1 关联规则和关联模式概述

2.1 关联规则和关联模式概述 数据挖掘的一个最受欢迎的任务就是发现源数据集之间的关系,它从不同的数据源(如购物篮数据、图数据或流数据)中发现频繁模式。 为了充分理解关联规则分析的目的,本章中所有算法均用R语言编写,这些代码使用算法的标准R添加包(如arules添加包)进行说明。

R语言数据挖掘第2章 频繁模式、关联规则和相关规则挖掘

第2章 频繁模式、关联规则和相关规则挖掘 本章中,我们将首先学习如何用R语言挖掘频繁模式、关联规则及相关规则。然后,我们将使用基准数据评估所有这些方法以便确定频繁模式和规则的兴趣度。本章内容主要涵盖以下几个主题: 关联规则和关联模式概述 购物篮分析 混合关联规则挖掘 序列数据挖掘 高性能算法 关联规...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

r语言数据挖掘相关内容