阿里云文档 2025-07-15

读写OSS数据

在PAI子产品(DLC或DSW)中,您可以使用ossfs 2.0客户端或JindoFuse组件(由阿里云EMR提供)将对象存储OSS类型的数据源挂载到容器的指定路径,也可以通过阿里云对象存储OSS提供的OSS Connector for AI/ML和OSS SDK来读取OSS数据。根据不同的应用场景,您可以选择合适的OSS数据读取方法。

阿里云文档 2025-03-17

读写NAS数据

您可以在PAI子产品DLC、DSW或EAS中绑定NAS/CPFS类型数据集,用来存储训练和部署所需的文件及结果文件。本文以通用型NAS文件系统为例,为您介绍如何在PAI子产品中挂载NAS/CPFS类型数据集。

阿里云文档 2025-03-06

大语言模型数据增强与模型蒸馏解决方案

大语言模型的训练和推理过程存在高能耗及长响应时间等问题,这些问题限制了其在资源有限场景中使用。为了解决这些问题,PAI提出了模型蒸馏功能。该功能支持将大模型知识迁移到较小模型,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求,为更多的实际应用场景提供支持。本文将以通义千问2(Qwen2)大语言模型为基础,为您介绍大语言模型数据增强和蒸馏解决方案的完整开发流程。

阿里云文档 2025-01-02

PAI-Rec推荐开发平台-运营工具-数据准备

本文档介绍为流量调控做数据准备、数据注册的过程

阿里云文档 2024-09-24

读写MaxCompute数据

在PAI子产品(DLC或DSW)中,您可以通过阿里云MaxCompute提供的PyODPS或人工智能平台PAI自主研发的paiio,实现MaxCompute数据的读写操作。针对不同的应用场景,您可以选择合适的MaxCompute数据读取方式。

文章 2024-06-19 来自:开发者社区

【机器学习】基于扩散模型的文本到音频生成:突破数据局限,优化音频概念与实践顺序

随着数字化技术的迅猛发展,音乐和电影行业对音频生成技术的需求日益旺盛。其中,从文本提示生成音频的技术正成为研究的热点。然而,现有的基于扩散模型的文本到音频生成方法,往往受限于数据集的大小和复杂性,难以准确捕捉并反映输入提示中的概念与事件的时间顺序。近日,一篇新的论文提出了一种在数据有限的情况下提升音频生成性能的方法,引发了业界的广泛关注。 一、现有模型的局限与挑战 当前...

【机器学习】基于扩散模型的文本到音频生成:突破数据局限,优化音频概念与实践顺序
文章 2024-04-30 来自:开发者社区

【Python机器学习专栏】文本数据的特征提取与表示

在机器学习和自然语言处理(NLP)领域,文本数据的特征提取与表示是至关重要的一步。由于计算机无法直接理解文本中的语义信息,我们需要将文本数据转换为计算机能够处理和理解的数值形式,这就是特征提取与表示的目的。本文将介绍几种常见的文本特征提取与表示方法,并展示如何在Python中实现它们。 一、文本数据的特征提取 文...

文章 2023-12-20 来自:开发者社区

【Python机器学习】K-Means对文本聚类和半环形数据聚类实战(附源码和数据集)

需要全部代码请点赞关注收藏后评论区留言私信~~~K-Mean算法,即 K 均值算法,是一种常见的聚类算法。算法会将数据集分为 K 个簇,每个簇使用簇内所有样本均值来表示,将该均值称为“质心”。K-Means++,算法受初始质心影响较小;表现上,往往优于 K-Means 算法;与 K-Means算法不同仅在于初始质心的选择方式不同Mini Batch K-Means与 K-Means 算法相比,大....

【Python机器学习】K-Means对文本聚类和半环形数据聚类实战(附源码和数据集)
文章 2022-12-05 来自:开发者社区

《机器学习中,使用Scikit-Leam简单处理文本数据》电子版地址

《机器学习中,使用Scikit-Leam简单处理文本数据》机器学习中,使用Scikit-Leam简单处理文本数据 电子版下载地址: https://developer.aliyun.com/ebook/7131 电子书: </div>

《机器学习中,使用Scikit-Leam简单处理文本数据》电子版地址
文章 2018-06-21 来自:开发者社区

面向机器学习的特征工程 三、文本数据: 展开、过滤和分块

来源:ApacheCN《面向机器学习的特征工程》翻译项目 译者:@kkejili 校对:@HeYun 如果让你来设计一个算法来分析以下段落,你会怎么做? Emma knocked on the door. No answer. She knocked again and waited. There was a large maple tree next to the...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注