R语言数据挖掘:从“挖井”到“淘金”
R语言数据挖掘:从“挖井”到“淘金” 在数据挖掘的世界里,很多人喜欢把它比作“淘金”。但我更愿意把它看成是“挖井”——只有深挖,才能找到清澈的数据源;只有细掘,才能汲取真正的价值。而在数据科学领域,R语言无疑是一把得心应手的“铁锹”,帮我们挖掘数据的深层价值。 为什么选择R语言? R语...
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
数据挖掘技术在跨区域犯罪预警中的研究与应用尚处于起步阶段,许多跨区域犯罪预警业务信息系统还停留在初级处理水平,缺乏综合性的开发应用,智能化的分析研判,科学性的决策预警;缺乏对数据由微观到宏观的加工能力,由宏观数据到微观数据的问题发现手段(点击文末“阅读原文”获取完整代码数据)。 相关视频 ...
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(下)
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(上): https://developer.aliyun.com/article/1497192 相比之下《黑暗骑士》排名波动较大,从上图可以看出,影片于2008年7月中旬上映,在几天之内冲到Top 250的第一,但在这个位置上它只保持了不到一个月,从8月10日开始连连下跌,最低跌到过第1...
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(上)
全文链接:https://tecdat.cn/?p=32998 本文首先介绍了IMDb(互联网电影资料库) TOP250及其排名算法、评分机制利弊,帮助客户通过分析《黑暗骑士》、《肖申克的救赎》和《教父》三部影片评分数据,分析排名变动的原因(点击文末“阅读原文”获取完整代码数据)。 其次,通过抓取曾经入选电影的生产国家、导演和演员、制作年份、风格流派以及当前入...
R语言公交地铁路线进出站数据挖掘网络图可视化
对于庞大的公交地铁路线信息的数据挖掘,一般软件遇到的问题主要有两点:1.对于文本信息的挖掘,特别是中文词汇的挖掘,缺乏成熟的工具或者软件包,2.对于大数据量,一般软件的读取和处理会遇到问题。即使一个月的部分区域路线信息也会达到几百m以上,因此,对于这类数据,无论从算法运行还是数据读取来说普通的SQL语言或者matlab软件处理起来都乏善可陈。对于这类数据,我们一般用r软件可以轻松实现读取,数据挖....
《R语言与数据挖掘最佳实践和经典案例》—— 导读
前言 数据挖掘自产生以来就是以分析数据、理解数据的实际需求为推动力的,其研究发展也逐步渗透到工业、农业、医疗卫生和商业的实际需求当中。R语言是在S语言的基础上逐步衍生出来的致力于数据统计分析与制图的语言。目前开源软件R也成为了世界上最流行的数据分析和处理工具之一,在学术研究和商业应用中都得到了广大数据分析者的青睐。 本书不是一本入门指导书,没有详细介绍数据挖掘技术的概念和理论,也没有介绍R语言的....
《R语言与数据挖掘最佳实践和经典案例》—— 3.5 将图表保存到文件中
本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第3章,第3.5节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.5 将图表保存到文件中 如果在数据探索的过程中生成了大量的图表,一种好的做法就是将所有的图表保存到一个文件中。R提供了很多函数用于保存图表。下面的例子分别使用函数pdf()和postscript()将图表保存....
《R语言与数据挖掘最佳实践和经典案例》—— 3.4 更多探索
本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第3章,第3.4节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.4 更多探索 本节将介绍一些图像,包括3D散布图、等级图、等高图、交互图以及平行坐标。一个3D散布图可以通过scatterplot3d包[Ligges and M鋍hler, 2003]生成(见图3-9)。 ....
《R语言与数据挖掘最佳实践和经典案例》—— 3.3 探索多个变量
本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第3章,第3.3节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3 探索多个变量 查看了单个变量的分布后,还需要探索两个变量之间的关系。下面我们使用函数cov()和cor()分别计算变量之间的协方差和相关系数。 接下来,使用函数aggregate()计算每一个鸢尾花种(S....
《R语言与数据挖掘最佳实践和经典案例》—— 3.2 探索单个变量
本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第3章,第3.2节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 探索单个变量 每一个数值型变量的分布情况可以使用函数summary()进行查看,该函数的返回值是变量中的最小值、最大值、平均值、中位数、第一四分位数(25%)和第三四分位数(75%)。对于因子(或分类变量....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。