阿里云文档 2025-09-17

跨命名空间共享数据集

Fluid利用Kubernetes的命名空间(Namespace)资源隔离特性,确保了数据集在计算任务与数据访问层面的安全控制,有效满足了跨团队数据隔离的需求。更进一步,Fluid实现了跨命名空间的数据访问及缓存资源共享,这意味着公开数据集能够在多个团队间复用,实现了单次缓存、多团队共享的高效模式,增强了数据的利用效率与管理的灵活性,为研发团队间的协同作业提供了便利。本文介绍如何配置跨命名空间共享...

阿里云文档 2025-07-07

OSS Connector在AI/ML数据集处理中的性能表现

在进行大规模机器学习或深度学习项目时,数据的高效加载与处理是提升整体训练效率的关键因素之一。本文通过对比分析在使用OSS内网域名与启用OSS加速器的情况下,不同数据集构建方法(OssIterableDataset、OssMapDataset、结合Ossfs和ImageFolder)的性能差异,旨在为用户提供数据访问策略的优化指南。

文章 2025-04-08 来自:开发者社区

AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 ️ "AI终于能听懂宝宝说话了!41小时真实童声数据集开...

AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
文章 2025-03-18 来自:开发者社区

最新AI大模型数据集解决方案:分享两种AI高质量代码数据集生产方案

最新AI大模型数据集解决方案:分享两种AI高质量代码数据集生产方案 在人工智能的世界里,数据是驱动创新和提升模型性能的核心动力。尤其对于大型预训练模型和微调模型,数据的质量直接决定了模型的能力。特别是在处理AI代码相关任务时,高质量的数据集更是不可或缺的基础。然而,构建这样一个高质量且符合需求的AI数据集,往往需要克服许多挑战——从获取到清洗,再到格式化,环环相扣,精细的操作和策略至关重...

最新AI大模型数据集解决方案:分享两种AI高质量代码数据集生产方案
文章 2024-09-08 来自:开发者社区

AI计算机视觉笔记二十一:PaddleOCR训练自定义数据集

续上一篇,PaddleOCR环境搭建好了,并测试通过,接下来训练自己的检测模型和识别模型。 paddleocr检测模型训练 1、准备数据集 在PaddleOCR目录下新建文件夹:train_data, 这个文件夹用于存放数据集的。 使用的是恩培提供的车牌识别数据集,下载car_plate_images.zip后,解压到train_data目录下 2、配置文件 在PaddleOCR主目...

AI计算机视觉笔记二十一:PaddleOCR训练自定义数据集
文章 2024-09-08 来自:开发者社区

AI计算机视觉笔记十六:yolov5训练自己的数据集

一般情况下,大部分人的电脑都是没有cpu的,cpu也是可以训练的,但花费的时间太长,实际200张图片,使用CPU训练300轮花了3天,本章记录使用云服务器来训练自己的数据集。 使用的云服务器是AutoDL,一直在使用,性价比还是比较高的。 AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL 训练疲劳驾驶行为检测 一、准备数据集 数据集可以自己拍照,也可以网上找,博主在网...

AI计算机视觉笔记十六:yolov5训练自己的数据集
问答 2024-07-17 来自:开发者社区

AI Earth预处理后数据集的图片通过这个water函数对图像进行进一步处理,有对应的api吗?

AI Earth预处理后数据集的图片通过这个water函数对图像进行进一步处理,有对应的api吗?

问答 2024-07-17 来自:开发者社区

AI Earth_windturbine数据集是否可以获取?

AI Earth_windturbine数据集是否可以获取?

阿里云文档 2024-07-04

如何配置数据集访问模式

Fluid弹性数据集的Dataset的访问模式默认设置为ReadOnlyMany(只读)。您可以通过修改Dataset.spec.accessModes字段指定Dataset访问模式。本文介绍如何配置数据集访问模式。

问答 2024-07-03 来自:开发者社区

AI Earth怎么获取样本数据集呢?

AI Earth怎么获取样本数据集呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"activityCardStyle","productCardInfo":{"productTitle":"","productDescription":"","productContentLink":"","isDisplayProductIcon":true,"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"AI 编码","activityDescription":"百万 Qwen-coder 大模型 tokens 免费体验,灵码79元起,加速 AI 应用落地 ","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock","activityButton1":{"activityButtonText":"查看详情","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding"},"activityButton2":{"activityButtonText":"立即体验","activityButtonLink":"https://bailian.console.aliyun.com/?spm=5176.30202035.J_VanPN1KXIVRyCVhZMwQ6t.6.1b791e71pokqL0&tab=model#/efm/model_experience_center/text?currentTab=textChat&modelId=qwen3-coder-plus"},"activityButton3":{"activityButtonText":"立即购买","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding#J_1"}}}
AI 编码
百万 Qwen-coder 大模型 tokens 免费体验,灵码79元起,加速 AI 应用落地

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注