文章 2022-04-19 来自:开发者社区

机器学习:盘点最常见的7种数据预处理方法和原理

目录1 数据规范化1.1 最值归一化1.2 Z-Score规范化2 类别平衡化2.1 阈值移动2.2 欠采样法(undersampling)2.3 过采样法(oversampling)3 连续值离散化4 缺失值处理5 哑言编码6 正则化6.1 L1正则6.2 L2正则7 数据降维1 数据规范化量纲,指将一个物理导出量用若干基本量的乘方之积表示出来的表达式。数据的比较需要关注两点——...

机器学习:盘点最常见的7种数据预处理方法和原理
文章 2022-04-19 来自:开发者社区

Python 机器学习实战(一):手撕决策树的原理、构造、剪枝、可视化

目录0 🌲写在前面1 🌲什么是决策树?2 🌲常见决策树算法2.1 👉 ID3算法2.2 👉 C4.5算法2.3 👉 CART算法3 🌲Python实现ID3决策树算法3.1 🍉架构设计3.2 🍉信息熵与信息增益计算3.3 🍉...

Python 机器学习实战(一):手撕决策树的原理、构造、剪枝、可视化
问答 2022-04-03 来自:开发者社区

机器学习算法中K近邻算法的工作原理是什么啊?

机器学习算法中K近邻算法的工作原理是什么啊?

文章 2021-12-22 来自:开发者社区

深入讨论机器学习 8 大回归模型的基本原理以及差异!

几乎每个机器学习从业者都知道回归,其中一些人可能认为这没什么大不了的,只是从参数之间的切 换罢了。本文将阐明每种回归算法的细节,以及确切的区别。包括 :OLSWeighted Least SquaresLassoRidgePolynomial RegressionLogistic regressionSupport Vector Regre...

深入讨论机器学习 8 大回归模型的基本原理以及差异!
文章 2020-05-22 来自:开发者社区

【图解机器学习】人人都能懂的算法原理

--------点击屏幕右侧或者屏幕底部“+订阅”,关注我,随时分享机器智能最新行业动态及技术干货---------- 机器学习这个主题已经很普遍了,每个人都在谈论它,但很少有人能够透彻地了解它。当前网络上的一些机器学习文章晦涩难懂,理论性太强,或者通篇云里雾里地介绍人工智能、数据科学的魔力以及未来的工作等。 所以呢,本文作者 vas3k 通过简洁的语言和清晰明了的图示内容,使得读者能够更容...

【图解机器学习】人人都能懂的算法原理
文章 2019-11-01 来自:开发者社区

机器学习算法—SVM支持向量机算法原理及阿里云PAI平台算法模块参数说明

概述: SVM支持向量机是最常用的机器学习分类算法之一,属于有监督学习。这种算法的本质是对数据进行二元线性分类,这种特点和其算法原理有直接关系,通俗来说SVM支持向量机在单一计算周期中只能将数据分成两类并且分隔的手段都表现为线性特征,如对于二维空间内的分隔为线,三维空间内为平面,更高维度的称为超平面。 算法原理: 1、通过散点图观察数据的分布情况,因为是一个二分类问题所以例子中的数据只有蓝色和红....

文章 2019-10-26 来自:开发者社区

机器学习算法—KMEANS算法原理及阿里云PAI平台算法模块参数说明

概述: KMEANS算法又被成为K均值算法,是一种常用的聚类算法,由于不需要根据给定的训练集训练模型因此是一种无监督学习算法。其本质是根据选定的参数K将数据分类成K类,在聚类过程中从单一样本开始通过不断计算聚类数据的均值来作为整个类的中心进而再将距离此类别中心最近的数据纳入同一类。 算法原理: 1、以下图样本散点图展示数据集的整体分布情况2、K值是KMEANS最重要的选择参数,直接决定着数据聚类....

文章 2019-10-25 来自:开发者社区

机器学习算法—KNN算法原理及阿里云PAI平台算法模块参数说明

概述: KNN算法一般也会经常被称为K邻近算法,其核心思想是根据训练集中的样本分类计算测试集中样本与训练集中所有样本的距离,根据所设定的K值选取前K个测试样本与训练样本最近的结果,结果中大多数训练样本所处在的类别即是本测试样本的类别。因训练样本的分类结果为已知因此KNN算法属于有监督学习算法。 算法原理: 1、以下图样本散点图展示训练集的整体分布情况从散点图中可以发现训练集的数据分类数量为3个类....

文章 2019-06-01 来自:开发者社区

Mahout 机器学习的基本原理

Mahout和Hadoop:机器学习的基本原理   这可能是现在收益最高,也是最受欢迎的一项技术之一。毫无疑问——作为开发人员,机器学习是一个能够大展身手的舞台。  计算技术通常用来分析数据,而理解数据则依赖于机器学习。多年来,对于大多数开发者来说,机器学习却是非常遥远、一直是难以企及的。   图1:机器学习的构成   机器学习是简单数据检索与存储的合理扩展。通过开发各种组件,使计算机更加智能学....

文章 2018-06-20 来自:开发者社区

机器学习(15)之支持向量机原理(一)线性支持向量机

前言 支持向量机(Support Vecor Machine,以下简称SVM)虽然诞生只有短短的二十多年,但是自一诞生便由于它良好的分类性能席卷了机器学习领域,并牢牢压制了神经网络领域好多年。如果不考虑集成学习的算法,不考虑特定的训练数据集,在分类算法中的表现SVM说是排第一估计是没有什么异议的。 SVM是一个二元分类算法,线性分类和非线性分类都支持。经过演进,现在也可以支持多元分类,同时经过扩....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注