文章 2017-08-01 来自:开发者社区

用数据说话,R语言有哪七种可视化应用?

今天,随着数据量的不断增加,数据可视化成为将数字变成可用的信息的一个重要方式。R语言提供了一系列的已有函数和可调用的库,通过建立可视化的方式进行数据的呈现。在使用技术的方式实现可视化之前,我们可以先和雷锋网一起看看如何选择正确的图表类型。  作者 Dikesh Jariwala是一个软件工程师,并且在Tatvic平台上编写了一些很酷很有趣的程序。他用API编写了第一版Price Disc...

用数据说话,R语言有哪七种可视化应用?
文章 2017-07-04 来自:开发者社区

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一1.3 数据清洗和建立用于分析的数据表示

本节书摘来自华章计算机《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一书中的第1章,第1.3节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan Temple Lang)  更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3 数据清洗和建立用于分析的数据表示 第一步工作比较简单,创建用于分析的数据结构,赋予变量有意义的名字,并将其转....

文章 2017-07-04 来自:开发者社区

《数据科学:R语言实现》——3.12 估计缺失数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.12节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.12 估计缺失数据 之前的教程介绍了如何检测数据集中的缺失数值。尽管包含缺失值的数据并不完整,但是我们还是要采用启发式的方法来补全数据集。这里,我们会介绍一些技术来估计缺失值。 准备工作 按照3.3节“转换数据类型”教程,把....

文章 2017-07-04 来自:开发者社区

《数据科学:R语言实现》——3.11 检测缺失数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.11节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.11 检测缺失数据 缺失数据背后有许多原因。例如,可能是由于录入或者数据处理过程中的瑕疵导致的。然而,如果数据分析过程使用了缺失数据,分析的结果可能有误导性。因此,在做进一步分析之前,检测缺失数据尤为重要。 准备工作 按照3....

文章 2017-07-04 来自:开发者社区

《数据科学:R语言实现》——3.10 重塑数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.10节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.10 重塑数据 重塑数据类似于创建列联表,它允许用户聚合特定值下的数据。reshape2程序包就是用来完成这个任务的。这里,我们会介绍如何使用reshape2程序包,借助函数dcast把长数据转换成宽数据。我们也会介绍如何使....

文章 2017-07-04 来自:开发者社区

《数据科学:R语言实现》——3.9 排列数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.9节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.9 排列数据 排列可以让我们在某种顺序下观察数据,以便更有效地分析数据。在数据库中,我们可以使用order by语句对指定的列进行数据排序。在R中,我们使用函数order和sort来对数据排序。 准备工作 按照3.3节“转换数....

文章 2017-07-04 来自:开发者社区

《数据科学:R语言实现》——3.8 合并数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.8节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.8 合并数据 数据合并让我们理解不同数据源是如何相互关联的。R中的merge操作与数据库中的join操作类似,它使用两个数据集中相同的值来连接两个数据集。 准备工作 按照3.3节“转换数据类型”教程,把导入数据的每个属性转换成....

文章 2017-07-04 来自:开发者社区

《数据科学:R语言实现》——3.7 舍弃数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.7节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.7 舍弃数据 在之前的教程中,我们介绍了如何修改和过滤数据集。这些步骤基本上涵盖了数据预处理和数据准备的主要过程。但是,我们还想找出数据集中的坏数据。那些坏数据或者不想要的数据应该丢弃,避免生成误导的结果。这里,我们会介绍一些....

文章 2017-07-04 来自:开发者社区

《数据科学:R语言实现》——3.6 过滤数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.6节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.6 过滤数据 数据过滤对于希望分析部分数据而不是全部数据集的读者来说是最常见的需求。在数据库操作中,我们可以使用带有where语句的SQL命令获取数据子集。在R中,我们也可以使用方括号来执行过滤操作。 准备工作 按照3.3节“....

文章 2017-07-03 来自:开发者社区

《数据科学:R语言实现》——3.2 重命名数据变量

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.2节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 重命名数据变量 数据框允许用户根据行名和列名选取和过滤数据。由于并不是所有的数据集都包含行名和列名,因此我们需要使用内置的命名函数重命名数据集。 准备工作 在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。