阿里云文档 2025-12-12

如何在DLC中使用PerfTracker进行性能诊断

PerfTracker是一个用于大模型训练的在线性能分析诊断工具,基于高精度的软硬件全栈信息在线监控。当任务性能出现问题时,它能在线获取各个Worker的所有CUDA核函数、Python函数执行记录及硬件监控记录,并生成分析报告,自动化诊断性能损失原因,如慢节点定位、瓶颈/耗时异常函数以及Hang问题等。本文为您介绍如何使用PerfTracker。

阿里云文档 2025-09-08

SWING算法工具使用文档

Swing 是阿里巴巴原创的一种新的match算法,不同于传统基于“点”的节点亲密度(proximity)计算方式,如:Common Neighbors, Adamic/Adar, Cosine Similarity, Jaccard Similarity, Wb-cosine, Rooted PageRank等,Swing会考虑网络结构信息,以高维的网络结构向二跳节点扩展,抗噪能力强,相比传统的...

阿里云文档 2025-08-26

swing召回算法工具

本文为您介绍改进版swing相似度计算算法原理,包括工具包下载、工具包详细参数说明以及常见问题等。

文章 2022-02-17 来自:开发者社区

2019年20个最佳Python人工智能和机器学习开源工具(项目)

参考资料 讨论钉钉群 21745728 本文最新版本地址 本文涉及的python测试开发库 谢谢点赞! 本文相关海量书籍下载 2018最佳人工智能机器学习工具书及下载(持续更新) TensorFlow最初是由研究人员和工程师在Google机器智能研究组织的Google Brain团队中开发的。 该系统旨在促进机器学习的研究,并使其从研究原型到生产系统的快速和轻松过渡。 Github UR...

2019年20个最佳Python人工智能和机器学习开源工具(项目)
文章 2022-02-16 来自:开发者社区

配置机器学习训练环境太麻烦?开源工具Parris说一键就搞定

本文来自AI新媒体量子位(QbitAI) 在搭建、训练机器学习模型的过程中,你的时间可能大部分都花在了那些与算法无关的事情上:收集数据、清洗数据、标注,甚至基础环境的配置,也需要不少时间。 有一个名叫Parris的开源工具,就要让配置基础环境这个环节自动化。今天,它刚被发布到Reddit论坛上就收获了不少赞。 据作者介绍,这个工具针对云端的机器学习训练,一键完成配置服务器、安装操作系统、安...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注