文章 2024-04-28 来自:开发者社区

R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据

全文链接:http://tecdat.cn/?p=31070 最近,在贝叶斯统计实验中,我们向客户演示了用R的朴素贝叶斯分类器可以提供的内容(点击文末“阅读原文”获取完整代码数据)。 这个实用的例子介绍了使用R统计环境的朴素贝叶斯模型。它不假设先验知识。 相关视频 ...

R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据
文章 2024-04-28 来自:开发者社区

R语言对耐克NIKEID新浪微博数据K均值(K-MEANS)聚类文本挖掘和词云可视化

全文链接:http://tecdat.cn/?p=31048 2009年8月,新浪微博(micro-blog)开始服务,随后各家微博服务在国内得到广泛传播和应用"(点击文末“阅读原文”获取完整代码数据)。 微博具有文本信息短(140字包括标点符号)、词量少、裂变式传播、传播速度快、用词不规范等特征,使原文本可视化研究技术框架中的聚类或分类方法提取热点话题变得困...

R语言对耐克NIKEID新浪微博数据K均值(K-MEANS)聚类文本挖掘和词云可视化
文章 2024-04-28 来自:开发者社区

R语言统计学DOE实验设计:用平衡不完全区组设计(BIBD)分析纸飞机飞行时间实验数据

全文链接:http://tecdat.cn/?p=31010 平衡不完全区组设计(BIBD)是一个很好的研究实验设计,可以从统计的角度看各种所需的特征(点击文末“阅读原文”获取完整代码数据)。 最近我们被客户要求撰写关于BIBD的研究报告,包括一些图形和统计输出。 对于一个BIBD有K个观测,重复r次实验。还有第5参数lamda,记录其中每对实验发生在...

R语言统计学DOE实验设计:用平衡不完全区组设计(BIBD)分析纸飞机飞行时间实验数据
文章 2024-04-28 来自:开发者社区

R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据(2)

全子集回归来选出最优的模型 全子集回归,即基于全模型获得可能的模型子集,并根据AIC值等对子集排序以从中获取最优子集。 重新拟合模型 ...

R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据(2)
文章 2024-04-28 来自:开发者社区

R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据(1)

全文链接:http://tecdat.cn/?p=30914 我们正和一位朋友讨论如何在R软件中用GLM模型处理全国的气候数据。本文获取了全国的2021年全国的气候数据(点击文末“阅读原文”获取完整代码数据)。 采样时间:2021年1月1号~2021年12月31号 采样地点:全国各地。 本次调查搜集了2021年全国不同地区的风向、降雨量、风速...

R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据(1)
文章 2024-04-26 来自:开发者社区

数据分享|R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据(下)

数据分享|R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据(上):https://developer.aliyun.com/article/1493901 AIC Akaike信息准则(AIC)是另一个模型选择的衡量标准。与似然比检验不同,AIC的计算不仅要考虑模型的拟合度,还要考虑模型的简单性。通过这种方式,AIC处理了模型的拟...

数据分享|R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据(下)
文章 2024-04-26 来自:开发者社区

数据分享|R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据(上)

全文链接:http://tecdat.cn/?p=22813 本教程为读者提供了使用频率学派的广义线性模型(GLM)的基本介绍。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法(点击文末“阅读原文”获取完整代码数据)。 本教程使用教育数据例子进行模型的应用。此外,本教程还简要演示了用R对GLM模型进行的多层次扩展。最后...

数据分享|R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据(上)
文章 2024-04-26 来自:开发者社区

R语言缺失数据变量选择LASSO回归:Bootstrap重(再)抽样插补和推算

全文链接:http://tecdat.cn/?p=30726 在存在缺失数据的情况下,需要根据缺失数据的机制和用于处理缺失数据的统计方法定制变量选择方法。我们专注于可以与插补相结合的随机和变量选择方法的缺失方法(点击文末“阅读原文”获取完整代码数据)。 我们围绕自举Bootstrap插补和稳定性选择技术进行一些咨询,帮助客户解决独特的业务问题,后者是为完全观察...

R语言缺失数据变量选择LASSO回归:Bootstrap重(再)抽样插补和推算
文章 2024-04-26 来自:开发者社区

数据分享|R语言逐步回归、方差分析anova电影市场调查问卷数据可视化

全文链接:http://tecdat.cn/?p=30680 这是一份有关消费者对电影市场看法及建议的调查报告,我们采取了问卷调查法,其中发放问卷256份,回收有效问卷200份(点击文末“阅读原文”获取完整代码数据)。 我们对数据(查看文末了解数据免费获取方式)进行了基本分析,比如:相关性。还有基本图形、回归方差分析。最后模型比较。 ...

数据分享|R语言逐步回归、方差分析anova电影市场调查问卷数据可视化
文章 2024-04-26 来自:开发者社区

R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响

全文链接:http://tecdat.cn/?p=30508 现实情况是,我们经常要处理多个自变量和一个因变量之间的关系,此外,虽然通过做散点图可以发现非线性关系,但很难归因其形式,多项式回归在广义线性模型中,由于其不可解释的系数,降低了模型的有用性(点击文末“阅读原文”获取完整代码数据)。 本文使用的广义加性模型提供了一种首选方案来研究多个自变量与因变量之间...

R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。