文章 2022-11-13 来自:开发者社区

机器学习原理与实战 | K-means聚类算法实践

%matplotlib inline import matplotlib.pyplot as plt import numpy as np1. K-均值算法介绍from sklearn.datasets import make_blobs # 产生聚类数据集 X, y = make_blobs(n_samples=200, # 样本数 n_f...

机器学习原理与实战 | K-means聚类算法实践
文章 2022-11-13 来自:开发者社区

机器学习原理与实战 | 决策树与集成算法实践

1.决策树算法原理决策树的基本原理是:对于一个数据集D DD,其基本的格式是由多个未知关联的多个特征共同决定一个输出。如果是分类问题,那么最后的输出是类别;而如果是回归问题,最后输出的是一个回归值。而在决策树的思想中,就是要对多个未知关联的特征挑选出最合适的一个特征(比如使用信息增益等等࿰...

机器学习原理与实战 | 决策树与集成算法实践
文章 2022-11-07 来自:开发者社区

机器学习原理篇:基础数学理论 Ⅱ

一、前言前面我们总结了有关微积分和线性代数的知识,本期我们继续总结有关概率论、数理统计以及最优化理论的知识。二、概率论概率论是研究随机先行数量规律的数学分支。随机现象是相对于决定性现象而言的,在一定条件下必然发生某一结果的现象称为决定性现象。概率论是学习人工智能必备的数学知识。概率论已经替代了逻辑主义的功能,被广泛应用于人工智能算法研究。概率论代表了一种...

机器学习原理篇:基础数学理论 Ⅱ
文章 2022-11-07 来自:开发者社区

机器学习原理篇:基础数学理论 Ⅰ

一、前言机器学习的理论基础就是数学基础,里面的很多模型都是建立在数学公式上的,其中数学理论主要包括微积分、线性代数、概率论、数理统计以及最优化理论等等理论知识。我们本学期就开设了机器学习的理论课,叫代数与逻辑,如果你以后想要往这方面发展的话,是必须要理解并学习掌握这些知识的,如果只是应对期末考试或者不想往这个方向...

机器学习原理篇:基础数学理论 Ⅰ
文章 2022-10-22 来自:开发者社区

机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)

1. 分类 - 交叉熵讲解博文:损失函数|交叉熵损失函数 - 知乎1.1 二分类-BCELoss系二分类可以使用BCELoss,比如链路预测任务预测某条边是否存在,或者多标签分类中将每个类作为一个二分类任务(但是一般来说这样效果会很差),就用BCELoss。torch.nn.BCEWithLogit...

机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)
文章 2022-07-08 来自:开发者社区

②机器学习之自然语言处理——基于TfidfVectorizer和CountVectorizer及word2vec构建词向量矩阵(代码+原理)

代码实操import numpy as np from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.feature_extraction.text import CountVectorizer text = ["今天 上 NLP 课程", "今天 的 课程 有 意思...

②机器学习之自然语言处理——基于TfidfVectorizer和CountVectorizer及word2vec构建词向量矩阵(代码+原理)
文章 2022-07-08 来自:开发者社区

①机器学习之自然语言处理——基于TfidfVectorizer和CountVectorizer及word2vec构建词向量矩阵(代码+原理)

理论知识准备前期我们对分词进行了详细的讲解,那么分词之后,哪些关键词对一个文档才是重要的?比如可以通过单词出现的次数,次数越多就表示越重要。构造文本特征向量Count (文档:空格连接的字符串)TFIDF (文档:空格连接的字符串)Word2Vec (文档:...

①机器学习之自然语言处理——基于TfidfVectorizer和CountVectorizer及word2vec构建词向量矩阵(代码+原理)
文章 2022-07-08 来自:开发者社区

机器学习自然语言处理之英文NLTK(代码+原理)

什么是自然语言处理?自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究如何能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。简单地说,自然语言处理( Natural Language Processing,简称 NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人...

机器学习自然语言处理之英文NLTK(代码+原理)
文章 2022-06-15 来自:开发者社区

不谈高级原理,只用简单的语言来聊聊机器学习

不谈高级原理,只用简单的语言来聊聊机器学习✨博主介绍🕴️前言😀为什么我们想要机器去学习?😃机器学习的3个组成部分😄学习 V.S. 智能😁机器学习世界的版图😉经典机器学习算法🍇有监督学习💌分类(Classification)⌛回归(Regres...

不谈高级原理,只用简单的语言来聊聊机器学习
文章 2022-06-07 来自:开发者社区

分布式机器学习原理及实战(Pyspark)

一、大数据框架及Spark介绍1.1 大数据框架大数据(Big Data)是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。自2003年Google公布了3篇大数据奠基性论文,为大数据存储及分布式处理的核心问题提供了思路:非...

分布式机器学习原理及实战(Pyspark)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注