阿里云文档 2025-10-16

灵骏智算使用本地缓存加速数据读取

AI 训练通常需要重复读取海量数据,这会产生巨大的网络开销,影响训练效率。在灵骏智算场景下,PAI提供了本地缓存加速功能,通过将数据缓存至本地计算节点,减少网络开销,提高训练吞吐,大幅提升数据读取性能,为您的 AI 训练任务提速。

文章 2025-09-10 来自:开发者社区

量子机器学习入门:三种数据编码方法对比与应用

在传统机器学习中数据编码确实相对直观:独热编码处理类别变量,标准化调整数值范围,然后直接输入模型训练。整个过程更像是数据清洗,而非核心算法组件。 量子机器学习的编码完全是另一回事。 传统算法可以直接消化特征向量 [0.7, 1.2, -0.3],但量子电路运行在概率幅和量子态的数学空间里。你的每个编码决策——是用角度旋转、振幅映射还是基态表示——都在重新定义信息在量子系统中的存在形式。这不是简单....

量子机器学习入门:三种数据编码方法对比与应用
阿里云文档 2025-08-25

iTAG智能标注预标注数据

iTAG可以开启智能标注,使用离线标注的结果预标注数据,然后在正式标注时,仅需要对预标注结果进行校验和修正,从而提升标注效率。

阿里云文档 2025-03-17

读写NAS数据

您可以在PAI子产品DLC、DSW或EAS中绑定NAS/CPFS类型数据集,用来存储训练和部署所需的文件及结果文件。本文以通用型NAS文件系统为例,为您介绍如何在PAI子产品中挂载NAS/CPFS类型数据集。

阿里云文档 2025-01-02

PAI-Rec推荐开发平台-运营工具-数据准备

本文档介绍为流量调控做数据准备、数据注册的过程

阿里云文档 2024-09-24

读写MaxCompute数据

在PAI子产品(DLC或DSW)中,您可以通过阿里云MaxCompute提供的PyODPS或人工智能平台PAI自主研发的paiio,实现MaxCompute数据的读写操作。针对不同的应用场景,您可以选择合适的MaxCompute数据读取方式。

文章 2024-04-30 来自:开发者社区

【Python 机器学习专栏】PCA(主成分分析)在数据降维中的应用

在当今大数据时代,数据的维度往往非常高,这给数据处理和分析带来了巨大的挑战。数据降维技术成为了处理高维数据的重要手段之一,而主成分分析(Principal Component Analysis,简称 PCA)是其中最常用的方法之一。本文将深入探讨 PCA 在数据降维中的应用,并通过 Python 代...

文章 2024-04-29 来自:开发者社区

【视频】R语言机器学习高维数据应用:Lasso回归和交叉验证预测房屋市场租金价格

全文链接:http://tecdat.cn/?p=32646 分析师:Junjun Li 在这篇文章中,我们将着重探讨高维数据下的机器学习应用,以房屋市场租金价格预测为例。 在实际生活中,房屋租金作为一个重要的经济指标,被广泛应用于城市规划、财务投资等方面的决策中。然而,如何准确地预测房屋租金价格却一直是一个具有挑战性的问题。 本文将介绍如何使...

【视频】R语言机器学习高维数据应用:Lasso回归和交叉验证预测房屋市场租金价格
文章 2023-12-20 来自:开发者社区

【机器学习】采集数据、特征工程、建立模型、应用四个阶段的详解(图文解释 超详细)

机器的这种学习能力,作为人工智能的核心要素,将会对人类社会的生产、生活、军事等活动产生难以估量的影响。那么,什么是机器学习(Machine Learning,ML)呢? 人类的学习中,最基础的是记忆,即机械的复述。但更重要的是指“举一反三”的能力。当用图片、文字、视频等教人们认识动物时,人们不仅记住了动物的知识,还学会了对真实的动物进行分析、辨认和判别,这是一种学习知识,并应用知识的能力。获得这....

【机器学习】采集数据、特征工程、建立模型、应用四个阶段的详解(图文解释 超详细)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注