《数据科学:R语言实现》——3.8 合并数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.8节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.8 合并数据 数据合并让我们理解不同数据源是如何相互关联的。R中的merge操作与数据库中的join操作类似,它使用两个数据集中相同的值来连接两个数据集。准备工作按照3....
《数据科学:R语言实现》——3.7 舍弃数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.7节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.7 舍弃数据 在之前的教程中,我们介绍了如何修改和过滤数据集。这些步骤基本上涵盖了数据预处理和数据准备的主要过程。但是,我们还想找出数据集中的坏数据。那些坏数据或者不想....
《数据科学:R语言实现》——3.6 过滤数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.6节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.6 过滤数据 数据过滤对于希望分析部分数据而不是全部数据集的读者来说是最常见的需求。在数据库操作中,我们可以使用带有where语句的SQL命令获取数据子集。在R中,我们....
《数据科学:R语言实现》——3.2 重命名数据变量
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.2节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 重命名数据变量 数据框允许用户根据行名和列名选取和过滤数据。由于并不是所有的数据集都包含行名和列名,因此我们需要使用内置的命名函数重命名数据集。准备工作在本教程中,....
《数据科学:R语言实现》——2.8 获取Facebook数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.9节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.9 使用twitteR 除了可以获取社交网络交互数据,我们也可以收集Twitter上大量推文信息进行文本挖掘任务。获取Twitter数据的方法与获取Facebook的非....
《数据科学:R语言实现》——2.8 获取Facebook数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.8节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.8 获取Facebook数据 社交网络数据对于发掘和分析社会交互的用户来说,是另一个很好的数据源。社交网络数据与网站数据的主要不同是,社交网络通常提供了半结构化的数据格....
《数据科学:R语言实现》——2.7 爬取网络数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.7节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.7 爬取网络数据 在多数情况下,数据并不会存在于数据库中,相反它们以各种形式遍布于互联网上。为了从这些数据源中挖掘更有价值的信息,我们需要知道如何在网络上访问和爬取数据....
《数据科学:R语言实现》——2.6 从数据库中读取数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.6节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.6 从数据库中读取数据 由于R会把数据读入内存中,因此这对于处理和分析小型数据集很合适。然而,由于企业每天积累的数据量要比个人的多得多,数据库文档在存储和分析大型数据时....
《数据科学:R语言实现》——2.2 下载公开数据
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.2节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 下载公开数据 在进行数据分析之前,一项基础工作是收集高质量的有意义的数据。一个重要的数据来源是公开数据集。它们通常经过挑选和整理,并允许公众自由使用。大多数公开数据....
《数据科学:R语言实现》——第2章 数据抽取、转换和加载
本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第1章,第1.1节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第2章 数据抽取、转换和加载 2.1 引言 在使用数据回答关键业务问题之前,最重要的事情是准备数据。数据通常存在文件中,使用Excel或者文本编辑器可以轻松地获取。但是数据....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。