《R语言数据分析与挖掘实战》——1.2 从餐饮服务到数据挖掘
本节书摘来自华章计算机《R语言数据分析与挖掘实战》一书中的第1章,第1.2节,作者 张良均,云伟标,王路,刘晓勇,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 从餐饮服务到数据挖掘 企业经营最大的目的就是盈利,而餐饮业企业盈利的核心就是其菜品和顾客,也就是其提供的产品和服务对象。企业经营者每天都在想推出什么样的菜系和种类能吸引更多的顾客,究竟不同顾客各自的喜好是什么,在不同的时....
《R语言数据分析与挖掘实战》——基础篇 第1章 数据挖掘基础 1.1 某知名连锁餐饮企业的困惑
本节书摘来自华章计算机《R语言数据分析与挖掘实战》一书中的第1章,第1.1节,作者 张良均,云伟标,王路,刘晓勇,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 基 础 篇 第1章 数据挖掘基础 1.1 某知名连锁餐饮企业的困惑 国内某餐饮连锁有限公司(以下简称T餐饮)成立于1998年,主要经营粤菜,兼顾湘菜、川菜等综合菜系。至今已经发展成为在国内具有一定知名度、美誉度、多品牌、立体....
R语言数据挖掘2.5.2 从序列模式中生成规则
2.5.2 从序列模式中生成规则 序列规则、标签序列规则和类序列规则都可以从序列模式中生成,这些可以从前面的序列模式发现算法中得到。
《R语言数据挖掘》——导读
前 言 世界各地的统计学家和分析师正面临着处理许多复杂统计分析项目的迫切问题。由于人们对数据分析领域的兴趣日益增加,所以R语言提供了一个免费且开源的环境,非常适合学习和有效地利用现实世界中的预测建模方案。随着R语言社区的不断发展及其大量程序包的不断增加,它具备了解决众多实际问题的强大功能。R编程语言诞生已经有数十年了,它已经变得非常知名,不但被社区的科学家而且被更广泛的开发者社区所熟知。它已经....
R语言数据挖掘2.4.2 GSP算法
2.4.2 GSP算法 广义序列模式(Generalized Sequential Pattern,GSP)算法是一个类似Apriori的算法,但它应用于序列模式。该算法是逐层算法,采取宽度优先策略。它具有如下的特征: GSP算法是Apriori算法的扩展。它利用Apriori性质(向下封闭),即,给定最小支持计数,若不接受某个序列,则其超序列也将丢弃。 需要对初始事务数据集进行多次扫描。 采.....
R语言数据挖掘2.4.1 序列数据集
2.4.1 序列数据集 序列数据集S定义为元组(sid, s)的集合,其中sid为序列ID,s为序列。 在序列数据集S中,序列X的支持度定义为S中包含X的元组数,即 supportS(X)={(sid, s)∨(sid, s)∈S←Xs} 这是序列模式的一个内在性质,它应用于相关的算法,如Apriori算法的Apr...
R语言数据挖掘2.2.5 基于最大频繁项集的GenMax算法
2.2.5 基于最大频繁项集的GenMax算法 GenMax算法用来挖掘最大频繁项集(Maximal Frequent Itemset,MFI)。算法应用了最大性特性,即增加多步来检查最大频繁项集而不只是频繁项集。这部分基于Eclat算法的事物编号集合交集运算。差集用于快速频繁检验。它是两个对应项目的事物编号集合的差。 可以通过候选最大频繁项集的定义来确定它。假定最大频繁项集记为M,若X属于M.....
R语言数据挖掘2.2.4.2 FP-growth算法
2.2.4.2 FP-growth算法 这里是递归定义的伪代码,其输入值为:R←GenerateFPTree(D), P← , F←
R语言数据挖掘2.2.2.4 Apriori算法的变体
2.2.2.4 Apriori算法的变体 为提升Apriori算法的效率和可扩展性,人们提出了Apriori算法的一些变体。下面介绍几种比较代表性的Apriori改进算法。
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。