文章 2023-11-01 来自:开发者社区

机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost

一、决策树(Desision Tree)1.一棵决策树的生成过程分为以下3个部分特征选择:指从训练数据中众多的特征中选择一个特征作为当前节点的分裂标准,如何选择特征有着很多不同量化评估标准,从而衍生出不同的决策树算法。决策树生成:根据选择的特征评估标准,从上至下递归地生成子节点,直到数据集不可分则停止决策树生长。剪枝:决策树容易过拟合,一般需要剪枝,缩小树结构规模,缓解过拟合。信息熵越低,纯度越....

机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost
文章 2023-07-03 来自:开发者社区

(附源码)基于sklearn的多种机器学习模型在降水降尺度中的应用(KNN\LR\RF\Ada\Xg\GBDT)2

3.  数据预处理3.1 scaling 特征项(统一量纲标准化)# 拆分特征项和目标项 feature = data.iloc[:, 1:14] # 拆分出特征项 target = data.iloc[:, 0] # 拆分出目标项 # 实例化一个标准器 scaler = RobustScaler() # 将数据标准化 feature = scaler.fit_transform(...

(附源码)基于sklearn的多种机器学习模型在降水降尺度中的应用(KNN\LR\RF\Ada\Xg\GBDT)2
文章 2023-07-03 来自:开发者社区

(附源码)基于sklearn的多种机器学习模型在降水降尺度中的应用(KNN\LR\RF\Ada\Xg\GBDT)1

最近学习了机器学习, 有一些感触,但是没有时间详细写。这里简单给一下我写的源码(并且我是在jupyter notebook上面做的报告,所以代码格式也是jupyter notebook的,如果你需要移动到pycharm上做修改,需要做一点点微调,这很简单。因为时间,我直接将我在jupyter notebook做报告的代码直接搬过来)。1. 准备工作1.1 包import numpy as np ....

(附源码)基于sklearn的多种机器学习模型在降水降尺度中的应用(KNN\LR\RF\Ada\Xg\GBDT)1
文章 2023-01-18 来自:开发者社区

【机器学习】集成学习(Boosting)——梯度提升树(GBDT)算法(理论+图解+公式推导)

2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、引言之前我们使用Boosting模型讲解了AdaBoost算法模型的原理,采用加法模型和向前分步算法,它是采用了很多个基学习器按照一定权重进行线性组合。f M ( x ) = ∑ m = 1 M a m f m ( x ) f_M(x)=\sum_{m=1}^Ma_mf_....

【机器学习】集成学习(Boosting)——梯度提升树(GBDT)算法(理论+图解+公式推导)
文章 2022-12-10 来自:开发者社区

机器学习入门:硬核拆解GBDT

Boosting到Gradient BoostingBoosting是集成学习的一种基分类器(弱分类器)生成方式,核心思想是通过迭代生成了一系列的学习器,给误差率低的学习器高权重,给误差率高的学习器低权重,结合弱学习器和对应的权重,生成强学习器。Boosting算法要涉及到两个部分,加法模型和前向分步算法。加法模型就是说强分类器由一系列弱分类器线性相加而成。一般组合形式如下:Gradient B....

机器学习入门:硬核拆解GBDT
文章 2022-06-13 来自:开发者社区

图解机器学习 | GBDT模型详解

作者:韩信子@ShowMeAI教程地址:http://www.showmeai.tech/tutorials/34本文地址:http://www.showmeai.tech/article-detail/193声明:版权所有,转载请联系平台与作者并注明出处1.GBDT算法GBDT(Gradient Boosting Decision Tree),全名叫梯度提升决策树,是一种迭代的决策树算法,又叫....

图解机器学习 | GBDT模型详解
文章 2022-02-16 来自:开发者社区

机器学习系列------1. GBDT算法的原理

GBDT算法是一种监督学习算法。监督学习算法需要解决如下两个问题: 1.损失函数尽可能的小,这样使得目标函数能够尽可能的符合样本 2.正则化函数对训练结果进行惩罚,避免过拟合,这样在预测的时候才能够准确。 GBDT算法需要最终学习到损失函数尽可能小并且有效的防止过拟合。 以样本随时间变化对某件事情发生的变化为例,如下几副图形象的说明了机器学习的作用。 假设随着时间的变化对K话题存在如下样本: .....

文章 2022-02-16 来自:开发者社区

机器学习(四)--- 从gbdt到xgboost

  gbdt(又称Gradient Boosted Decision Tree/Grdient Boosted Regression Tree),是一种迭代的决策树算法,该算法由多个决策树组成。它最早见于yahoo,后被广泛应用在搜索排序、点击率预估上。       xgboost是陈天奇大牛新开发的Boosting库。它是一个大规模、分布式的通用Gradi...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注