阿里云文档 2026-06-03

使用eRDMA网络进行分布式训练

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。

阿里云文档 2026-06-02

使用灵骏智算资源提交DLC任务时配置高性能网络变量和镜像

在大模型的AI并行计算中,通过降低通信量、计算和通信交叠、提升通信效率来优化计算性能。本文介绍如何使用高性能网络进行配置,以实现上述目标。

文章 2024-10-18 来自:开发者社区

目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务(从数据准备到训练测试部署的完整流程)

一、目标分类介绍 目标分类是一种监督学习任务,其目标是根据输入数据的特征将其分配到预定义的类别中。这种分类方法在许多实际应用中都有广泛的应用,如垃圾邮件检测、图像识别、情感分析等。 目标分类的基本流程包括:数据预处理(如清洗、标准化)、特征提取、模型选择和训练、模型评估和优化。其中,模型的选择和训练是关键步骤,常见的分类算法有决策树、支持向量机、神经网络等。 目标分类的优点是可以自动地进行分类,....

目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务(从数据准备到训练测试部署的完整流程)
文章 2023-04-19 来自:开发者社区

LeNet网络搭建与基本训练流程

模型class LeNet(nn.Module): def __init__(self): super(LeNet, self).__init__() # 解决继承父类中出现的一系列问题 self.conv1 = nn.Conv2d(3, 16, 5) self.pool1 = nn.MaxPool2d(2, 2) se...

LeNet网络搭建与基本训练流程
问答 2022-07-29 来自:开发者社区

GAN 网络训练流程图示是怎样的?

GAN 网络训练流程图示是怎样的?

文章 2022-02-17 来自:开发者社区

神经网络的训练的大致流程

batch_size = n # 每次读取一小部分数据作为当前的训练数据来执行反向传播算法 x = tf.placeholder(tf.float32, shape=(batch_size, feature_num), name="x-input") y_= tf.placeholder(tf.float32, shape=(batch_size, 1), name='y-input') #...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

域名解析DNS

关注DNS行业趋势、技术、标准、产品和最佳实践,连接国内外相关技术社群信息,追踪业内DNS产品动态,加强信息共享,欢迎大家关注、推荐和投稿。

+关注