文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(5)

Python 机器学习算法交易实用指南(四)(4)https://developer.aliyun.com/article/1523386 生成模型 狄利克雷分布在 LDA 主题模型中占据重要地位,该模型假设当作者将文章添加到一系列文档中时,存在以下生成过程: 根据主题概率随机混合一小部分共享主题 K 对于每个词语,根据文档-主题概率选择其中一个主题...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(3)

Python 机器学习算法交易实用指南(四)(2)https://developer.aliyun.com/article/1523384 从文本到标记 - NLP 管道 在本节中,我们将演示如何使用开源 Python 库spaCy构建 NLP 管道。textacy库构建在spaCy之上,并提供对spaCy属性和附加功能的简便访问。 有关以下代码示例、安装说明和额外详细信...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(2)

Python 机器学习算法交易实用指南(四)(1)https://developer.aliyun.com/article/1523382 t-SNE t-分布随机邻域嵌入是由劳伦斯·范德马滕(Laurens van der Maaten)和杰夫·辛顿(Geoff Hinton)于 2010 年开发的获奖算法,用于检测高维数据中的模式。它采用概率、非线性方法来定位位于几个不同但相...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(1)

第十二章:无监督学习 在第六章,机器学习流程中,我们讨论了无监督学习如何通过发现数据中的结构而增加价值,而无需一个指导搜索过程的结果变量,例如老师。这个任务与我们在过去几章中专注于的监督学习的设置形成对比。 当数据集只包含特征而没有结果的测量值,或者当我们想要提取与结果无关的信息时,无监督学习算法可以很有用。目标不是预测未来的结果,而是研究对解决另一个任务有用的数据的信息表示,包...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(5)

Python 机器学习算法交易实用指南(三)(4)https://developer.aliyun.com/article/1523357 二阶损失函数近似 最重要的算法创新通过使用依赖于二阶导数的近似来降低评估损失函数的成本,类似于牛顿法找到稳定点。因此,在贪婪树扩展过程中评分潜在分割的速度相对于使用完整损失函数更快。 正如先前提到的,梯度提升模型是以增量方式训练的,其...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(4)

Python 机器学习算法交易实用指南(四)(3)https://developer.aliyun.com/article/1523385 条件独立性假设 使得模型既可行又有理由称其为朴素的假设是,特征在结果条件下是独立的。为了说明,让我们对一个包含三个词Send money now的电子邮件进行分类,这样贝叶斯定理就变成了以下形式: 形式上,三个词条件独立的假...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(4)

Python 机器学习算法交易实用指南(三)(3)https://developer.aliyun.com/article/1523356 随机森林 决策树不仅因其透明度和可解释性而有用,而且是更强大的集成模型的基本构建模块,它将许多个体树与策略结合起来,以随机变化其设计,以解决前一节讨论的过拟合和高方差问题。 集成模型 集成学习涉及将多个机器学习模型组合成一个新...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(3)

Python 机器学习算法交易实用指南(三)(2)https://developer.aliyun.com/article/1523355 收敛 我们可以随时间和它们的分布可视化样本,以检查结果的质量。下面的图表显示了初始 100 和额外的 100,000 个样本后的后验分布,并说明了收敛意味着多个链识别相同的分布。pm.trace_plot()函数也显示了样本的演变(更多信息请...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(2)

Python 机器学习算法交易实用指南(三)(1)https://developer.aliyun.com/article/1523351 如何构建波动率预测模型 为资产收益序列开发波动率模型包括四个步骤: 基于 ACF 和 PACF 显示的序列依赖性构建金融时间序列的 ARMA 时间序列模型。 再次依靠残差序列的 ACF 和 PACF 检查模型的残...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(1)

第八章:时间序列模型 在上一章中,我们重点关注了适用于横截面数据的线性模型,其中输入数据属于与其旨在解释或预测的输出相同的时间段。在本章中,我们将关注时间序列数据,其中观察值按周期而不同,这也创建了自然的排序。我们的目标是识别数据中的历史模式,并利用这些模式来预测时间序列在未来的行为。 在上一章中,我们已经遇到了既有横截面又有时间序列维度的面板数据,并了解了法马-麦克白斯回归如何...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Python学习站

Python学习资料大全,包含Python编程学习、实战案例分享、开发者必知词条等内容。

+关注
相关镜像