文章 2024-09-10 来自:开发者社区

训练集、测试集与验证集:机器学习模型评估的基石

在机器学习中,为了评估模型的性能,我们通常会将数据集划分为训练集(Training Set)、验证集(Validation Set)和测试集(Test Set)。这种划分有助于我们更好地理解模型在不同数据上的表现,并据此调整模型参数,避免过拟合和欠拟合。本文将详细介绍这三个集合的作用,并通过代码演示如何进行数据集的划分。 目录 一、训练集、验证集与测试集的作用 二、为什么...

训练集、测试集与验证集:机器学习模型评估的基石
文章 2024-03-18 来自:开发者社区

【机器学习】样本、特征、标签:构建智能模型的三大基石

引言: 在机器学习的世界里,数据是驱动模型训练和性能提升的核心要素。 而在这浩渺的数据海洋中,样本、特征和标签无疑构成了最为关键的三大基石。它们相互关联、相互作用,共同构建起了智能模型的骨架和灵魂。 本文将深入探讨样本、特征和标签的概念、重要性及其在机器学习中的协同作用,旨在帮助读者更好地理解它们对于构建高效、准确的机器学习模型所起到的关键作用。 ...

【机器学习】样本、特征、标签:构建智能模型的三大基石
文章 2022-02-17 来自:开发者社区

干货 | 林轩田机器学习「基石+技法」历史文章汇总

台湾大学林轩田机器学习经典课程:「机器学习基石」和「机器学习技法」。课程由浅入深、内容全面,基本涵盖了机器学习领域的很多方面,还包括了机器学习一些经典算法,包括支持向量机、决策树、随机森林、神经网络等。如果你对我的文章和内容有什么想法和建议的话,欢迎在文章底部直接留言或直接在公众号交流,我会尽量及时回复ÿ...

文章 2022-02-17 来自:开发者社区

干货|机器学习基石精选文章链接

下面这部分内容列出了机器学习基石的精选文章。包括什么时候机器能够学习?为什么机器能够学习?机器如何进行学习?机器如何更好地学习?四个方面。如果你对我的文章和内容有什么想法和建议的话,欢迎在文章底部直接留言或直接在公众号交流,我会尽量及时回复!期待与你的探讨,共同学习,共同...

干货|机器学习基石精选文章链接
文章 2022-02-17 来自:开发者社区

台湾大学林轩田机器学习基石课程学习笔记16(完结) -- Three Learning Principles

1Occam’s Razor奥卡姆剃刀定律(Occam’s Razor),是由14世纪逻辑学家、圣方济各会修士奥卡姆的威廉(William of Occam,约1285年至1349年)提出。奥卡姆(Ockham)在英格兰的萨里郡,那是他出生的地方。他在《箴言书注》2卷15...

台湾大学林轩田机器学习基石课程学习笔记16(完结) -- Three Learning Principles
文章 2022-02-17 来自:开发者社区

台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

1Model Selection Problem机器学习模型建立的过程中有许多选择,例如对于简单的二元分类问题,首先是算法A的选择,有PLA,pocket,linear regression,logistic regression等等;其次是迭代次数T的选择,有100,1...

台湾大学林轩田机器学习基石课程学习笔记15 -- Validation
文章 2022-02-17 来自:开发者社区

台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization

1. Regularized Hypothesis Set先来看一个典型的overfitting的例子:如图所示,在数据量不够大的情况下,如果我们使用一个高阶多项式(图中红色曲线所示),例如10阶,对目标函数(蓝色曲线)进行拟合。拟合曲线波动很大,虽然Ein...

台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization
文章 2022-02-17 来自:开发者社区

台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度增加。本节课介绍这种模型复杂度增加带来机器学习中一个很重要的问题:过拟合(overfitting)。一、What is Overfittin...

台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting
文章 2022-02-17 来自:开发者社区

台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation

一、Quadratic Hypothesis之前介绍的线性模型,在2D平面上是一条直线,在3D空间中是一个平面。数学上,我们用线性得分函数s来表示:。其中,x为特征值向量,w为权重,s是线性的。线性模型的优点就是,它的VC Dimension比较小,保证了Ein≈Eout...

台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation
文章 2022-02-17 来自:开发者社区

台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

上一节课,我们介绍了Logistic Regression问题,建立cross-entropy error,并提出使用梯度下降算法gradient descnt来获得最好的logistic hypothesis。本节课继续介绍使用线性模型来解决分类问题。一、Linear Models for Binary Classification之前介绍几种线性模型...

台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注