阿里云文档 2025-07-07

在DLC中使用EPL实现训练加速

EPL(Easy Parallel Library)是高效易用的分布式模型训练框架,深度集成多种训练优化技术,提供了简单易用的API实现各种并行化策略。您可以使用EPL实现低成本、高性能分布式模型训练。本文为您介绍如何在DLC中使用EPL高效地进行分布式TensorFlow训练。前提条件在开始执行操...

文章 2024-10-11 来自:开发者社区

【机器学习】揭秘深度学习优化算法:加速训练与提升性能

学习目标 知道常见优化方法的问题及解决方案 传统的梯度下降优化算法中,可能会碰到以下情况: 碰到平缓区域,梯度值较小,参数优化变慢 碰到 “鞍点” ,梯度为 0,参数无法优化 碰到局部最小值 对于这些问题, 出现了一些对梯度下降算法的优化方法. 例如:Momentum、AdaGrad、RMSprop、Adam 等. 指数加权平均 ...

【机器学习】揭秘深度学习优化算法:加速训练与提升性能
文章 2020-04-15 来自:开发者社区

阿里云容器服务团队实践——Alluxio优化数倍提升云上Kubernetes深度学习训练性能

AI训练新趋势:基于Kubernetes的云上深度学习作者简介车漾,阿里云高级技术专家,从事Kubernetes和容器相关产品的开发。尤其关注利用云原生技术构建机器学习平台系统,是GPU共享调度的主要作者和维护者。顾荣,南京大学副研究员,Alluxio项目核心开发者,研究方向大数据处理,2016年获南京大学博士学位,曾在微软亚洲研究院、英特尔、百度从事大数据系统实习研发。背景介绍近些年,以深度学....

阿里云容器服务团队实践——Alluxio优化数倍提升云上Kubernetes深度学习训练性能
文章 2017-12-26 来自:开发者社区

云上深度学习实践(一)-GPU云服务器TensorFlow单机多卡训练性能实践

目录云上深度学习实践(一)-GPU云服务器TensorFlow单机多卡训练性能实践云上深度学习实践(二)-云上MXNet实践 1 背景  2015年11月9日,Google发布深度学习框架TensorFlow。Google表示,TensorFlow在设计上尤其针对克服其第一代深度学习框架DistBelief 的短板,灵活、更通用、易使用、更快,而且完全开源。在短短的一年时间内,在GitH...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

智能引擎技术

AI Online Serving,阿里巴巴集团搜推广算法与工程技术的大本营,大数据深度学习时代的创新主场。

+关注