文章 2022-11-13 来自:开发者社区

机器学习原理与实战 | 决策树与集成算法实践

1.决策树算法原理决策树的基本原理是:对于一个数据集D DD,其基本的格式是由多个未知关联的多个特征共同决定一个输出。如果是分类问题,那么最后的输出是类别;而如果是回归问题,最后输出的是一个回归值。而在决策树的思想中,就是要对多个未知关联的特征挑选出最合适的一个特征(比如使用信息增益等等),来对数据集D DD进行划分,划分为多个子数据集。然后,对于这些同样的感觉信息增益进一步划分子数据集,这是一....

机器学习原理与实战 | 决策树与集成算法实践
文章 2022-06-07 来自:开发者社区

分布式机器学习原理及实战(Pyspark)

一、大数据框架及Spark介绍1.1 大数据框架大数据(Big Data)是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。自2003年Google公布了3篇大数据奠基性论文,为大数据存储及分布式处理的核心问题提供了思路:非结构化文件分布式存储(GFS)、分布式计算(MapReduce)及结构化数据存储(B....

分布式机器学习原理及实战(Pyspark)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注