文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【18】KMeans聚类中的常见问题

KMeans聚类中的常见问题使用make_blobs创建样本点samples,targets = datasets.make_blobs(n_samples=150,n_features=2,centers=3,random_state=1) plt.scatter(samples[:,0],samples[:,1],c=targets) 1、K值不合适km = KMeans(n_cluster....

【阿旭机器学习实战】【18】KMeans聚类中的常见问题
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【16】KMeans算法介绍及实战:利用KMeans进行足球队分类

一. 聚类—K均值算法(K-means)介绍【关键词】K个种子,均值1. K-means算法原理聚类的概念:一种无监督的学习,事先不知道类别,自动将相似的对象归到同一个簇中。K-Means算法是一种聚类分析(cluster analysis)的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。K-Means算法主要解决的问题如下图所示。我们可以看到,在图的左边有一些点,....

【阿旭机器学习实战】【16】KMeans算法介绍及实战:利用KMeans进行足球队分类
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【15】人脸自动补全(多目标回归),并比较5种不同模型的预测效果

机器学习实战—人脸自动补全(多目标预测)目标通过上半部分的人脸图案来预测下边部分人脸,进行人脸补全。实质是一个多目标预测问题,对每一个目标点都会进行模型建模,然后通过相应模型对各个点进行预测数据集采用Olivetti人脸数据集包含400张灰度的64*64像素的人脸图像,每个图像被展平为大小为4096的一维向量,40个不同的人拍照十次。from sklearn.neighbors import K....

【阿旭机器学习实战】【15】人脸自动补全(多目标回归),并比较5种不同模型的预测效果
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【12】决策树基本原理及其构造与使用方法

决策树【关键词】树,信息增益,信息熵决策树的优缺点优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据;既能用于分类,也能用于回归;数据形式非常容易理解。缺点:可能会产生过度匹配问题一、决策树的原理一个决策树的游戏:【二十个问题的游戏】游戏的规则很简单:参与游戏的一方在脑海里想某个事物,其他参与者向他提问题,只允许提20个问题,问题的答案也只能用对或错回答。问问题....

【阿旭机器学习实战】【12】决策树基本原理及其构造与使用方法
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【11】文本分类实战:利用朴素贝叶斯模型进行邮件分类

本文主要介绍如何使用朴素贝叶斯模型进行邮件分类,置于朴素贝叶斯模型的原理及分类,可以参考我的上一篇文章《【阿旭机器学习实战】【10】朴素贝叶斯模型原理及3种贝叶斯模型对比:高斯分布朴素贝叶斯、多项式分布朴素贝叶斯、伯努利分布朴素贝叶斯》。文本分类实战读取文本数据import pandas as pd# sep参数代表指定的csv的属性分割符号 sms = pd.read_csv("../data....

【阿旭机器学习实战】【11】文本分类实战:利用朴素贝叶斯模型进行邮件分类
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【10】朴素贝叶斯模型原理及3种贝叶斯模型对比:高斯分布朴素贝叶斯、多项式分布朴素贝叶斯、伯努利分布朴素贝叶斯

朴素贝叶斯【关键词】 概率,贝叶斯公式,古典数学朴素:独立性假设贝叶斯公式优点:朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率;对小规模的数据表现很好;能处理多分类任务,适合增量式训练;对缺失数据不太敏感,算法也比较简单,常用于文本分类缺点:只能用于分类问题需要计算先验概率;分类决策存在错误率;对输入数据的表达形式很敏感1. 朴素贝叶斯原理朴素贝叶斯算法是一个典型的统计....

【阿旭机器学习实战】【10】朴素贝叶斯模型原理及3种贝叶斯模型对比:高斯分布朴素贝叶斯、多项式分布朴素贝叶斯、伯努利分布朴素贝叶斯
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【8】逻辑斯蒂回归原理及实战

逻辑斯蒂回归【关键词】Logistics函数,最大似然估计,梯度下降法,随机梯度下降(SGD)1、Logistics回归的原理利用Logistics回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归” 一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的做法就是寻找最佳拟合参数,使用的是最优化算法。接下来介绍这个二值型输出分类器的数学原理Logist....

【阿旭机器学习实战】【8】逻辑斯蒂回归原理及实战
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【7】岭回归基本原理及其λ的选取方法

线性回归之岭回归1、原理如果数据的特征数比样本点还多应该怎么办?是否还可以使用普通的线性回归来做预测?答案是否定的。因为输入数据的矩阵X不是满秩矩阵。非满秩矩阵在求逆时会出现问题。为了解决这个问题,统计学家引入了岭回归(ridge regression)的概念。缩减方法可以去掉不重要的参数,因此能更好地理解数据。此外,与简单的线性回归相比,缩减法能取得更好的预测效果。【注意】在岭回归里面,决定回....

【阿旭机器学习实战】【7】岭回归基本原理及其λ的选取方法
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【9】随机梯度下降(SGD)进行乳腺癌良恶性预测,并与逻辑斯蒂回归预测结果进行对比

梯度下降模型(SGD)—乳腺癌良恶性预测读取数据import pandas as pd import numpy as npcancer = pd.read_csv("../data/cencerData.csv") cancer.head(10) 特征说明:Sample code number 索引ID ;Clump Thickness 肿瘤厚度;Uniformity of Cell Size....

【阿旭机器学习实战】【9】随机梯度下降(SGD)进行乳腺癌良恶性预测,并与逻辑斯蒂回归预测结果进行对比
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【6】普通线性线性回归原理及糖尿病进展预测实战

1、原理回归是对连续型的数据做出预测。分类的目标变量是标称型数据。如何从一大堆数据里求出回归方程呢?假定输人数据存放在矩阵X中,而回归系数存放在向量W中。那么对于给定的数据X1, 预测结果将会通过Y=X*W给出。现在的问题是,手里有一些X和对应的Y,怎样才能找到W呢?一个常用的方法就是找出使误差最小的W。这里的误差是指预测Y值和真实Y值之间的差值,使用该误差的简单累加将使得正差值和负差值相互抵消....

【阿旭机器学习实战】【6】普通线性线性回归原理及糖尿病进展预测实战

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注