文章 2024-04-16 来自:开发者社区

R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

通过对用电负荷的消费者进行聚类,我们可以提取典型的负荷曲线,提高后续用电量预测的准确性,检测异常或监控整个智能电网(Laurinec等人(2016),Laurinec和Lucká( 2016))。第一个用例通过K-medoids聚类方法提取典型的电力负荷曲线。 有50个长度为672的时间序列(消费者),长度为2周的耗电量的时间序列。这些测量来自智能电表。 维数太高,并且会发生维数...

R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
文章 2024-04-16 来自:开发者社区

R语言:用R语言填补缺失的数据

缺少数据在分析数据集时可能不是一个微不足道的问题。 如果缺失数据的量相对于数据集的大小非常小,那么为了不偏离分析而忽略缺少特征的少数样本可能是最好的策略,但是留下可用的数据点会剥夺某些数据的特征。 尽管某些快速修正如均值替代在某些情况下可能很好,但这种简单的方法通常会向数据中引入偏差。 在这篇文章中,我们将使用airquality数据集(在R中提供)来推测缺失值。 ...

R语言:用R语言填补缺失的数据
文章 2024-04-16 来自:开发者社区

R语言中对文本数据进行主题模型topic modeling分析

主题建模 在文本挖掘中,我们经常收集一些文档集合,例如博客文章或新闻文章,我们希望将其分成自然组,以便我们可以分别理解它们。主题建模是对这些文档进行无监督分类的一种方法,类似于对数字数据进行聚类,即使我们不确定要查找什么,也可以找到自然的项目组。 潜在狄利克雷分配(LDA)是拟合主题模型特别流行的方法。它将每个文档视为主题的混合体,并将每个主题看作是单词的混合体。这允许文档在内容...

R语言中对文本数据进行主题模型topic modeling分析
文章 2024-04-16 来自:开发者社区

R语言数据的收益率和可能的波动性交易

Quantom的最新版本(可以从CRAN安装)现在包含了从2000年以来从AlphaVantage获得免费财务数据的一种方法,通常对于大多数后测来说已经足够了,因为该日期早于大多数ETF的开始。 以下是如何做到这一点。 首先,你需要去alphaVantage,注册,并https://www.alphavantage.co/support/#api-key获得一个API密钥。 ...

R语言数据的收益率和可能的波动性交易
文章 2024-04-16 来自:开发者社区

R语言中ARMA,ARIMA(Box-Jenkins),SARIMA和ARIMAX模型用于预测时间序列数据

在本文中,我将介绍ARMA,ARIMA(Box-Jenkins),SARIMA和ARIMAX模型如何用于预测给定的时间序列数据。   使用后移运算符计算滞后差分 我们可以使用backshift运算符来执行计算。例如,后轴运算符可用于计算的时间序列值的滞后差异ÿy经由yi−Bk(yi),∀i∈k+1,…,tyi−Bk(yi),∀i∈k+1,…,t其中kk表示的差异...

R语言中ARMA,ARIMA(Box-Jenkins),SARIMA和ARIMAX模型用于预测时间序列数据
文章 2024-04-16 来自:开发者社区

R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

维度降低有两个主要用例:数据探索和机器学习。它对于数据探索很有用,因为维数减少到几个维度(例如2或3维)允许可视化样本。然后可以使用这种可视化来从数据获得见解(例如,检测聚类并识别异常值)。对于机器学习,降维是有用的,因为在拟合过程中使用较少的特征时,模型通常会更好地概括。 在这篇文章中,我们将研究三维降维技术: 主成分分析(PCA):最流行的降维方法 内核...

R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告
文章 2024-04-16 来自:开发者社区

R语言文本挖掘NASA数据网络分析,tf-idf和主题建模

NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。我们可以使用这些数据集的元数据来理解它们之间的联系。 1 NASA如何组织数据 首先,让我们下载JSON文件,并查看元数据中存储的名称。 me...

R语言文本挖掘NASA数据网络分析,tf-idf和主题建模
文章 2024-04-16 来自:开发者社区

R语言进行数值模拟:模拟泊松回归模型的数据

模拟回归模型的数据 验证回归模型的首选方法是模拟来自它们的数据,并查看模拟数据是否捕获原始数据的相关特征。感兴趣的基本特征是平均值。我喜欢这种方法,因为它可以扩展到广义线性模型(logistic,Poisson,gamma,...)和其他回归模型,比如t -regression。 您的标准回归模型假设存在将预测变量与结果相关联的真实/固定参数。但是,当我们执行回归时,我们只估计这...

R语言进行数值模拟:模拟泊松回归模型的数据
文章 2024-04-16 来自:开发者社区

Prophet在R语言中进行时间序列数据预测

在本文中您将学习如何使用Prophet(在R中)解决一个常见问题:预测公司明年的每日订单。   数据准备与探索 先知最适合每日定期数据以及至少一年的历史数据。我们将使用SQL处理每天要预测的数据: `select `` date, value ...

Prophet在R语言中进行时间序列数据预测
文章 2024-04-16 来自:开发者社区

R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

预测GDP增长 我们复制了Ghysels(2013)中提供的示例。我们进行了MIDAS回归分析,以预测季度GDP增长以及每月非农就业人数的增长。预测公式如下 其中yt是按季度季节性调整后的实际美国GDP的对数增长,x...

R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。