R语言数据挖掘1.2 数据源
1.2 数据源 数据充当数据挖掘系统的输入,因此数据存储库是非常重要的。在企业环境中,数据库和日志文件是常见来源;在网络数据挖掘中,网页是数据的来源;连续地从各种传感器中提取数据也是典型的数据源。 这里有一些免费的在线数据源十分有助于学习数据挖掘: 频繁项集挖掘数据存储库(Frequent Itemset Mining Dataset Repository):一个带有数据集的存储库,用于找到频.....
R语言数据挖掘1.3 数据挖掘
1.3 数据挖掘 数据挖掘就是在数据中发现一个模型,它也称为探索性数据分析,即从数据中发现有用的、有效的、意想不到的且可以理解的知识。有些目标与其他科学,如统计学、人工智能、机器学习和模式识别是相同的。在大多数情况下,数据挖掘通常被视为一个算法问题。聚类、分类、关联规则学习、异常检测、回归和总结都属于数据挖掘任务的一部分。 数据挖掘方法可以总结为两大类数据挖掘问题:特征提取和总结。
《R语言数据挖掘》----第2章 频繁模式、关联规则和相关规则挖掘 2.1关联规则和关联模式概述
本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.1节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第2章 频繁模式、关联规则和相关规则挖掘 本章中,我们将首先学习如何用R语言挖掘频繁模式、关联规则及相关规则。然后,我们将使用基准数据评估所有这些方法以便确定频繁模式和规则的兴趣....
《R语言数据挖掘:实用项目解析》——导读
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的导读,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 目 录前言第1章 使用R内置数据进行数据处理 1.1 什么是数据挖掘 1.2 R语言引论 1.2.1 快速入门 1.2.2 数据类型、向量、数组与矩阵 1.2.3 列表管理、因子与序列 1...
《R语言数据挖掘》----1.17 总结
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.17节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.17 总结 本章讨论了以下主题: 数据挖掘和可用的数据源。 R语言的简要概述以及使用R语言的必要性。 统计学和机器学习,以及它们与数据挖掘关系的描述。 两个标准的行业数据挖....
《R语言数据挖掘》----1.16 练习
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.16节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.16 练习 现在,让我们来检测到目前为止我们所学习的知识: 数据挖掘和机器学习有什么区别? 什么是数据预处理?什么是数据质量? 在你的计算机上下载R并安装R。 比较数据挖掘....
《R语言数据挖掘》----1.15 结果可视化
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.15节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.15 结果可视化 可视化是数据描述的图形表示,以便一目了然地揭示复杂的信息,包括所有类型的结构化信息表示。它包括图形、图表、图解、地图、故事板以及其他结构化的图示。 好的可....
《R语言数据挖掘》----1.14 数据变换与离散化
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.14节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.14 数据变换与离散化 根据前面的内容,我们可以知道总有一些数据格式最适合特定的数据挖掘算法。数据变换是一种将原始数据变换成较好数据格式的方法,以便作为数据处理前特定数据挖....
《R语言数据挖掘:实用项目解析》——第2章,第2.10节小结
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.10节小结,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 小结探索性数据分析几乎是所有类型的数据挖掘项目都要执行的一项重要操作。解读分布、分布的形状和分布的重要参数是相当重要的。提前的假设检验可帮助我们更好地理解数据。不仅是分布及其性质,不同变量....
《R语言数据挖掘:实用项目解析》——第2章,第2.8节假设检验
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.8节假设检验,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.8 假设检验零假设意味着什么都没有发生、平均值是恒定的,等等。对立假设则意味着有什么发生了,且平均值与总体有所不同。进行假设检验的步骤如下:1)提出零假设:提出关于总体的假设。例如,....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。