《R语言数据挖掘:实用项目解析》——第2章,第2.4节解读分布和变换
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.4节解读分布和变换,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.4 解读分布和变换为了对所有统计假设检验的前提假设有清晰的认识,理解概率分布至关重要。例如,在线性回归分析中,基本的前提假设是误差分布呈正态分布且变量关系为线性。所以在建立模型....
《R语言数据挖掘》----1.7 为什么选择R
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.7节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.7 为什么选择R R是一种高质量、跨平台、灵活且广泛使用的开源免费语言,可用于统计学、图形学、数学和数据科学。它由统计学家创建,并为统计学家服务。 R语言包含了5000多种算....
《R语言数据挖掘:实用项目解析》——第2章,第2.3节多元分析
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.3节多元分析,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.3 多元分析多元分析是指以统计方法观察多个因变量和自变量以及它们之间的关系。本节将简述两个以上变量之间的多元关系,多元分析的细节将于后续章节中详细讨论。多变量之间的多元关系可利用相关....
《R语言数据挖掘》----1.6 网络数据挖掘
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.6节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.6 网络数据挖掘 网络挖掘的目的是从网络超链接结构、网页和使用数据来发现有用的信息或知识。网络是作为数据挖掘应用输入的最大数据源之一。 网络数据挖掘基于信息检索、机器学习(M....
《R语言数据挖掘:实用项目解析》——第2章,第2.2节二元分析
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.2节二元分析,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.2 二元分析二元分析是指研究两个变量之间的关系或关联。有三种可能的方向:数值-数值的关系数值-分类的关系分类-分类的关系假设要判断两个数值变量之间的二元关系。若两个变量恰好都是连续型....
《R语言数据挖掘:实用项目解析》——第2章,第2.1节一元分析
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.1节一元分析,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 第2章汽车数据的探索性分析探索性数据分析是数据挖掘中不可或缺的一环。它包括数据集中变量的数值描述和图形化表示,这将使数据集变得易于理解并有助于用户快速得出结论。对数据集有一个初步的理解很....
《R语言数据挖掘》----1.5 文本挖掘
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.5节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 文本挖掘 文本挖掘基于文本数据,关注从大型自然语言文本中提取相关信息,并搜寻有意义的关系、语法关系以及提取实体或各项之间的语义关联。它也被定义为自动或半自动的文本处理。相....
《R语言数据挖掘:实用项目解析》——第1章,第1.14节小结
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.14节什么是数据挖掘,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 小结通过之前的讨论可以得出这样的结论:数据处理和数据管理是很多实际数据挖掘项目执行中的重要一环。由于R语言提供了较好的统计编程平台和可视化,因此用R语言来向读者解释很多数据挖掘原....
《R语言数据挖掘:实用项目解析》——第1章,第1.13节缺失值(NA)的处理
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.13节缺失值(NA)的处理,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.13 缺失值(NA)的处理缺失值处理在标准数据挖掘场景中是一个重要的任务。在R语言中,缺失值显示为NA。NA既不是字符串也不是数值型变量,它们被当作缺失值的标识。在将数....
《R语言数据挖掘:实用项目解析》——第1章,第1.12节字符串操作
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.12节字符串操作,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.12 字符串操作字符串操作或字符操作是所有数据管理系统中的一个重要方面。比如在一个典型的实际数据集里,客户的名字会有多种写法,如J H Smith、John h Smith、Jo....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。