《R语言数据挖掘》----1.13 数据降维
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.13节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.13 数据降维 在分析复杂的多变量数据集时,降低维度往往是必要的,因为这样的数据集总是以高维形式呈现。因此,举例来说,从大量变量来建模的问题和基于定性数据多维分析的数据挖掘....
《R语言数据挖掘》----1.12 数据集成
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.12节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.12 数据集成 数据集成将多个数据源中的数据合并,形成一个一致的数据存储。其常见的问题如下:异构数据:这没有普遍的解决方案。 不同的定义(different definit....
《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.9节无参数方法,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.9 无参数方法当一个训练数据集不满足任何假定的某种概率分布时,唯一的选择就是通过无参数方法分析数据集。无参数方法不服从概率分布假设。使用无参数方法,我们可以不基于概率分布的前提假设....
《R语言数据挖掘》----1.11 数据清洗
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.11节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.11 数据清洗 数据清洗是数据质量的一部分,数据质量(Data Quality,DQ)的目标如下:准确性(数据被正确记录)。 完整性(所有相关数据都被记录)。 唯一性(没有....
《R语言数据挖掘》----1.10 数据属性与描述
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.10节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.10 数据属性与描述 属性(attribute)是代表数据对象的某些特征、特性或者维度的字段。 在大多数情况下,数据可以用矩阵建模或者以矩阵形式表示,其中列表示数据属性,行....
《R语言数据挖掘:实用项目解析》——第2章,第2.7节列联表、二元统计及数据正态性检验
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.7节列联表、二元统计及数据正态性检验,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.7 列联表、二元统计及数据正态性检验列联表是由两个或多个分类变量及每个分类所占比例构成的频率表。频率表展示的是一个分类变量,而列联表用来展示两个分类变量。我们....
《R语言数据挖掘》----1.9 机器学习
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.9节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.9 机器学习 应用于机器学习算法的数据集称为训练集,它由一组成对的数据(x, y)构成,称为训练样本。成对的数据解释如下:x:这是一个值向量,通常称为特征向量。每个值或者特征....
《R语言数据挖掘:实用项目解析》——第2章,第2.6节变量分段
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.6节变量分段,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.6 变量分段在将连续变量纳入模型之前,需要对其进行处理。以Cars93数据集中的油箱容量为例,基于油箱容量,我们可以创建一个分类变量,值为高、中和低、低中: 油箱容量的值域为9...
《R语言数据挖掘》----1.8 统计学
本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.8节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.8 统计学 统计学研究数据收集、数据分析、数据解释或说明,以及数据表示。作为数据挖掘的基础,它们的关系将在下面章节中说明。 1.8.1 统计学与数据挖掘 第一次使用数据挖掘这....
《R语言数据挖掘:实用项目解析》——第2章,第2.5节解读分布
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.5节解读分布,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.5 解读分布计算概率分布、将数据点拟合于一些特定类型的分布以及后续的解读有助于建立假设。此假设可用于在给定一组参数下估算事件的概率。我们来看看对不同类型分布的解读。解读连续型数据一个....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。