【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享(上)
生存分析的名称源于临床研究,其中预测死亡时间,即生存,通常是主要目标。 生存分析是一种回归问题(人们想要预测一个连续值),但有一个转折点。它与传统回归的不同之处在于,在生存分析中,结果变量既有一个事件,也有一个与之相关的时间值,部分训练数据只能被部分观察——它们是被删失的。本文用R语言生存分析晚期肺癌患者数据(查看文末了解数据获取方式)。 普通最小二乘回归方法不足,因为...
R语言气象模型集成预报:神经网络、回归、svm、决策树用环流因子预测降雨降水数据
我们被客户要求撰写关于气象集成预报技术的研究报告,包括一些图形和统计输出。在实际应用中,对每个具体的问题,各种预报方法得出的结果通常是不一致的,因而不知道如何将它们统一起来。因此需要采用一种较好的处理方法,把不同预报方法对同一要素的多种预报结果综合在一起,从而得出一个优于单一预报方法的预报结论,这就是预报方法的集成问题。 本文分析了传统的基于加权的集成预报方法及其在气象预测应用中存在的问...
R语言DCC-GARCH模型对上证指数、印花税收入时间序列数据联动性预测可视化
在对上证指数、印花税收入联动性预测时,我们向客户演示了用R语言的DCC-GARCH可以提供的内容。 读取所有数据 ...
R语言SVR支持向量机多元回归、网格搜索超参数优化预测猪粮比价格变动率数据
我们需要拟合支持向量机回归模型:进行网格搜索超参数优化并使用训练好的模型进行预测推理、使用plot函数可视化线图对比预测值和实际值。 数据 ...
R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据
全文链接:http://tecdat.cn/?p=30914 我们正和一位朋友讨论如何在R软件中用GLM模型处理全国的气候数据。本文获取了全国的2021年全国的气候数据(点击文末“阅读原文”获取完整代码数据)。 采样时间:2021年1月1号~2021年12月31号 采样地点:全国各地。 本次调查搜集了2021年全国不同地区的风向、降雨量、风速...
数据分享|R语言、SPSS基于主成分PCA的中国城镇居民消费结构研究可视化分析
全文链接:http://tecdat.cn/?p=31563 以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等 8 个指标数据(查看文末了解数据免费获取方式)为依据, 利用SPSS和R统计软件, 采用主成分分析法对当前城镇居民消费结构进行分析(点击文末“阅读原文”获取完...
数据分享|R语言豆瓣数据文本挖掘 神经网络、词云可视化和交叉验证
全文链接:http://tecdat.cn/?p=31544 在网络技术高速发展的背景下,信息纷乱繁杂,如何能够获得需要的文本信息,成了许多企业或组织关注的问题(点击文末“阅读原文”获取完整代码数据)。 该项目以采集的豆瓣电影评论数据(查看文末了解数据免费获取方式)为例,使用R语言和神经网络算法,对文本挖掘进行全流程的分析,包括对其特征及其子集进行提取,并对文...
数据分享|R语言谱聚类社会化推荐挖掘协同过滤电影社交网站Flixster数据集应用研究
全文链接:http://tecdat.cn/?p=31502 本课题着眼于谱聚类在社会化推荐挖掘中的应用研究(点击文末“阅读原文”获取完整代码数据)。 摘要 谱聚类算法是基于图论的数据聚类算法,与其他聚类方法相比具有明显的优势:建立在谱图理论的基础之上;操作简单,易...
数据分享|R语言PCA主成分、lasso、岭回归降维分析近年来各国土地面积变化影响
全文链接:http://tecdat.cn/?p=31445 机器学习在环境监测领域的应用,着眼于探索全球范围内的环境演化规律,人类与自然生态之间的关系以及环境变化对人类生存的影响(点击文末“阅读原文”获取完整代码数据)。 课题着眼于环境科学中的近年来土地面积变化影响的课题,应用机器学习的方法,进行数据处理与分析预测。数据的处理方法以及机器学习本身算法理论的学...
R语言稀疏主成分分析、因子分析、KMO检验和Bartlett球度检验分析上市公司财务指标数据
全文链接:http://tecdat.cn/?p=31080 R中的主成分分析(PCA)和因子分析是统计分析技术,也称为多元分析技术(点击文末“阅读原文”获取完整代码数据)。 当可用的数据有太多的变量无法进行分析时,主成分分析(PCA)和因子分析在R中最有用,它们在不损害他们所传达的信息的情况下减少了需要分析的变量的数量。 我们和一位客户讨论过如何在R...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。