文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【27】贝叶斯模型:新闻分类实战----CounterVecorizer与TfidVectorizer构建特征向量对比

1. 导入数据并查看信息from sklearn.datasets import fetch_20newsgroups from sklearn.model_selection import train_test_split# 加载新闻数据 news = fetch_20newsgroups(subset='all') • 1 • 2# data为一个列表,长度18846,每一个元素为一个新闻内....

文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【26】逻辑斯蒂回归----糖尿病预测实战

1. 导入并查看数据信息import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 载入数据 data = pd.read_csv('./diabetes.csv') data.head() 数据说明:Pregnancies:怀孕次数Glucose:葡萄糖测试值Blo....

【阿旭机器学习实战】【26】逻辑斯蒂回归----糖尿病预测实战
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【25】决策树模型----树叶分类实战

决策树进行树叶分类实战1. 导入数据import pandas as pd import matplotlib.pyplot as plt from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.tree import Deci....

【阿旭机器学习实战】【25】决策树模型----树叶分类实战
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【24】信用卡用户流失预测实战

问题描述依据某国外匿名化处理后的真实数据集,通过建模,判断该用户是否已经流失。1. 读取数据并分离特征与标签import pandas as pd import numpy as np # 读取数据 train_data = pd.read_csv('./Churn-Modelling.csv') test_data = pd.read_csv('./Churn-Modelling-Test-D....

【阿旭机器学习实战】【24】信用卡用户流失预测实战
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【23】特征降维实战---人脸识别降维建模,并选出最有模型进行未知图片预测

PCA特征降维实战—人脸识别问题描述–人脸识别通过训练一批人的人脸数据,然后从其他地方获取一种图片让模型认识这个图片代表的谁?判断人脸需要用监督学习,人脸的维度过高,监督学习判断的时候就会出现两个问题:算法效率会非常低和算方法的精准度也会降低。我们在进行监督学习之前要进行特征降维,然后使用降维后的特征进行建模,以提高算法效率与准确度。1. 导入数据并查看数据import numpy as np ....

文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【22】特征降维实战---主成分分析(PCA)与线性判别分析算法(LDA)

1. 特征降维的主要目的1)在实际的项目中经常会遭遇到特征维度非常高的样本(比如图片),往往无法借助于自己领域的知识来构建有效的特征2)在数据表现方面,我们无法观测超过三维的数据2. 常见特征降维的算法是主成分分析:PCAPCA算法核心:把高维度的向量向低维度投影1)去平均值,即每一位特征减去各自的平均值2)计算矩阵协方差和特征向量与特征值3)把特征值从小到大排序4)保留前K个特征值对应的特征向....

文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【21】通过SVM分类与回归实战案例,对比支持向量机(SVM)3种SVM不同核函数

1. 3种SVM不同核函数介绍线性核函数linear适用范围:主要用于线性可分的情况。特点:其特征空间到输入空间的维度是一样的,参数少速度快,可解释性强,可以比较容易的知道哪些特征是重要的。它对于线性可分情况分类效果比较理想,因此我们通常会先尝试用线性核函数来做分类,看看效果如何,如果不行再换其他的核函数。多项式核函数(poly)适用范围:可用于线性与非线性分类。特点:通过将低维的输入空间映射到....

【阿旭机器学习实战】【21】通过SVM分类与回归实战案例,对比支持向量机(SVM)3种SVM不同核函数
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【20】支持向量机SVM原理简介及示例演示:画出SVM二维决策边界与分离非线性坐标点

支持向量机SVM简介及示例演示【关键词】支持向量,最大几何间隔,拉格朗日乘子法1. 支持向量机的原理支持向量机(Support Vector Machine),其含义是通过支持向量运算的分类器。其中“机”的意思是机器,可以理解为分类器。那么什么是支持向量呢?在求解的过程中,会发现只根据部分数据就可以确定分类器,这些数据称为支持向量。见下图,在一个二维环境中,其中点R,S,G点和其它靠近中间黑线的....

【阿旭机器学习实战】【20】支持向量机SVM原理简介及示例演示:画出SVM二维决策边界与分离非线性坐标点
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【19】如何在不减少分辨率的情况下降低图片存储空间?K-Means算法进行图片颜色点分类存储

前言在如今的互联网时代,网络上充满了海量的数据,当然也包括很多图片。因此图像压缩技术对于压缩图像和减少存储空间变得至关重要。本文我们将使用无监督学习算法K-means聚类算法通过对图片颜色点进行聚类的方式,达到降低图片存储空间的目的。图像由称为像素的几个强度值组成。在彩色图像中, 每个像素为3个字节, 每个像素包含RGB(红-蓝-绿)值, 该值具有红色强度值, 然后是蓝色, 然后是绿色强度值。具....

【阿旭机器学习实战】【19】如何在不减少分辨率的情况下降低图片存储空间?K-Means算法进行图片颜色点分类存储
文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【17】KMeans聚类算法中如何选择合适的聚类个数K

KMeans聚类算法中如何选择合适的聚类个数?问题描述我们随机生成一些二维点的数据,然后通过不同的K值对其进行分类评估。具体步骤:随机生成一些二维点选取不同的K值进行模型训练,并计算轮廓系数画出K值与轮廓关系的折线图,看取哪一个K值合适1. 随机生成二维数据点import numpy as npx1 = np.random.randint(1,10,size=14) x2 = np.random....

【阿旭机器学习实战】【17】KMeans聚类算法中如何选择合适的聚类个数K

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注