什么是AI通信加速库Deepnccl

多机CPU-Reduce:该优化继承了单机内CPU-Reduce高效的异步流水线,并将跨机Socket通信也设计为流水线形态,实现多机通信全过程流水化,有效减少通信延迟,提高整体训练性能。例如,在通信量较大的Transformer-based模型的多机训练场景下,...

什么是Deepytorch Training(训练加速)

多机CPU-Reduce:该优化继承了单机内CPU-Reduce高效的异步流水线,并将跨机Socket通信也设计为流水线形态,实现多机通信全过程流水化,有效减少通信延迟,提高整体训练性能。例如,在通信量较大的Transformer-based模型的多机训练场景下,...

什么是AI分布式训练通信优化库AIACC-ACSpeed

因此,基于PCIe-topo机型搭建的多机训练环境下,您可以将单机CPU-Reduce扩展到多机,充分释放单机的性能,同时解决以Socket连接为主的跨机通信的扩展性问题。优化方法 多机CPU-Reduce的实现继承了单机CPU-Reduce高效的异步流水线,将跨...

基于eRDMA增强型实例部署AI训练集群

在NCCL底层通信链接上,有多种不同的传输方式,例如单机内部多卡P2P通信以及多机上的传统socket通信(如VPC网络)和高性能的InfiniBand(IB)通信,其中eRDMA是一种基于RDMA的传输方式,具有极低的延迟,并且在性能上接近RDMA网络的优势。...

安装ACCL库

ACCL(Alibaba Collective Communication Library)是一款高性能通信库,提供了AllReduce、AllToAllV、Broadcast等常用集合操作接口以及点到点Send/Recv接口,为多机多卡训练提供高效的通信支持。本文为您介绍如何安装ACCL库。背景信息 ...

云边通信组件Raven概述

边缘云场景中,计算设备往往分布在个隔离的地域和网络域。因此,集群中的边缘设备往往采用分组管理,导致了不同分组的节点之间以及其下应用之间网络不互通等隔离性问题。为提升云边运维和监控能力,ACK Edge集群 引入了云边通信组件Raven...

系统设置

网络设置 启用网络通信:设置指令系统与授权主机之间的通信状态,启用网络通信服务。授权地址:设置网络通信后端服务地址。服务主机:设置网络通信后端服务主机。服务路径:网络通信后端服务路径。消息设置 启用消息通信:启动网络消息通信...

电商压测场景示例

业务会话中的多个API是串行关系。根据业务逻辑,业务会话2:购买产品B 中的一系列用户行为是存在先后顺序的,所以将这些存在先后关系的API添加到一个业务会话中,PTS压测中会按照顺序发起压测。综合来看,在压测中,示例中的 浏览产品A 的...

电商压测场景示例

串联链路中的多个API是串行关系。根据业务逻辑,串联链路2:购买产品B 中的一系列用户行为是存在先后顺序的,所以将这些存在先后关系的API添加到一个串联链路中,PTS压测中会按照顺序发起压测。综合来看,在压测中,示例中的 浏览产品A 的...

并行步骤

执行并行步骤会并发执行所有分支包含的串行步骤。这些串行步骤会改变其分支对应的本地变量。当所有分支执行结束后,可以通过输出映射将分支本地变量数组转换为并行步骤的输出。说明 并行步骤最大分支数限制为100。并行步骤包含以下属性:...

概述

物联网平台支持广播通信,即向指定产品下的全量设备(设备无需订阅广播Topic),或订阅了指定Topic的所有设备发送消息。设备在线,即可收到服务器发送的广播消息。本文介绍通过配置C Link SDK,设备端实现广播通信功能。前提条件 已准备...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨跳交换转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

基本介绍

steps(必需):定义了流程的多串行步骤。一个步骤执行完成后,如果成功,则会执行下一个步骤。如果需要提前结束,可以使用步骤的结束(end)属性,或者使用成功和失败步骤。inputMappings(可选):输入映射。输入映射中引用的$input 是...

选择步骤

(可选)steps:定义了选项所对应的多串行步骤。(可选)goto:指定跳转目的步骤名称,该目的步骤只能是和选择步骤并列的一个步骤。(必需)default:默认选项。(可选)steps:定义了选项所对应的多串行步骤。(可选)goto:指定跳转...

快速开始

本章节介绍了如何快速使用弹性并行查询。...cost_threshold_for_mpp 若查询语句的串行执行代价超过该阈值,优化器会考虑弹性扩展为多机并行。默认值为cost_threshold_for_parallelism的N倍,N值为当前集群地址内的节点个数。

并行查询配置参数说明

cost_threshold_for_mpp session 查询语句的串行执行代价超过该阈值后,优化器会考虑选择多机并行执行方式。取值范围:[0-18446744073709551615];默认值为0,含义是 自动取值cost_threshold_for_parallelism的N倍,N为节点个数。并行查询...

超级计算集群概述

机型对比 SCC与物理机、虚拟机的对比如下表所示。其中,Y表示支持,N表示不支持,N/A表示无数据。功能分类 功能 SCC 物理机 虚拟机 运维自动化 分钟级交付 Y N Y 计算 免性能损失 Y Y N 免特性损失 Y Y N 免资源争抢 Y Y N 存储 完全兼容...

通过SAG vCPE实现阿里云与Azure互通

w WAN口的网卡名称。您可以通过 ifconfig 或 ip-br address 命令查看宿主机的网卡名称。执行脚本时,系统会自动检测部署环境是否满足需求。如果部署环境相关的组件安装不完整,系统会出现下图提示,请输入:yes,系统将自动帮您安装相关...

准备工作

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。可用IP数 显示可以使用的IP地址的数量。IPv6网段 交换机的IPv6网段。交换机的IPv6网段的掩码...

双机直挂静态路由上云

配置端口IP:interface GigabitEthernet 0/12 switchport access vlan 10/将连接智能接入网关1 LAN口的端口划分到VLAN 10下 interface GigabitEthernet 0/14 switchport access vlan 10/将连接智能接入网关2 LAN口的端口划分到VLAN 10下 ...

基本概念

它是在传输通信协议(TCP/IP)上实现的一种安全协议,采用公开密钥技术为TCP/IP连接提供数据加密、服务器认证、消息完整性以及可选的客户认证。SSL证书采用公钥体制,即利用一对互相匹配的密钥对进行数据加密和解密。每个用户自己设定一...

部署要求

上云通道和高速通道需支持10 Gbps速率的物理接口,每台云盒上联交换至少提供2个物理接口(单柜)或4个物理接口(柜),接入云盒以及对应数量的/30 地址。说明 上云通道指的是云盒与阿里云公共云之间网络互通的通道,包含云盒管控流量和...

双机旁挂动态路由上云

interface GigabitEthernet 0/11 no switchport ip ospf network point-to-point#网络类型必选为p2p ip ospf hello-interval 3 ip ospf dead-interval 10 ip address 192.168.100.2 255.255.255.252#智能接入网关1对端交换机的端口IP ...

双机直挂动态路由上云

interface GigabitEthernet 0/11 no switchport ip ospf network point-to-point#网络类型必须为p2p ip ospf hello-interval 3 ip ospf dead-interval 10 ip address 192.168.50.2 255.255.255.252#智能接入网关1对端交换机的端口IP ...

BatchPub

调用接口BatchPub通过自定义Topic,向指定产品下的多个设备,批量发送消息。使用说明 单批次最多向同一产品下的100个设备发送消息。调用本接口时,请求参数中 TopicShortName 与 TopicTemplateName 必须二选一使用。如果同时传入 ...

Pub

若后续需要新增更设备订阅自定义Topic的广播消息,可使用MQTT 5.0版本通信协议进行通信,通过设置自定义Topic支持保留消息广播和设置自定义Topic消息为保留消息来实现。使用说明,请参见 UpdateTopicConfig。使用限制 该接口不支持下发...

IPsec-VPN入门概述

通过IPsec-VPN可建立专有网络VPC(Virtual Private Cloud)与本地数据中心间的VPN连接,实现本地数据中心和VPC之间的加密通信。背景信息 IPsec连接支持绑定VPN网关实例和转发路由器实例。本文仅介绍IPsec连接绑定VPN网关实例的场景下IPsec-...

分配端口角色

LAN 用于接入本地网络客户端或交换机的端口,支持动态IP或静态IP接入方式。更详情请参见 配置LAN。专线 用于接入专线的端口。更详情请参见 配置专线。重要 在智能接入网关管理控制台进行端口角色修改操作会同时修改主备智能接入...

云企业网中VPC实例下的交换机网段冲突的解决方法

问题描述 云企业网中连接了个VPC实例,个VPC实例下的交换网段存在冲突,导致个VPC实例下的ECS实例之间无法通过云企业网实现正常通信。解决方案 请根据您的实际需求,选择以下任意一种方式解决网段冲突问题:使用VPC NAT网关产品...

JMeter个线程组的使用说明

当JMeter测试计划中存在个线程组,您需要了解如何结合JMeter和PTS配置参数,使个线程组并行或串行压测。前提条件 创建JMeter压测场景。具体操作,请参见 创建JMeter场景。背景信息 JMeter线程组包括setUp线程组、tearDown线程组和主线...

M2M设备间通信

M2M(即Machine-to-Machine)是一种端对端通信技术。本章节以智能灯和手机App连接为例,分别使用规则引擎数据流转和Topic消息路由来实现M2M设备间通信,主要介绍如何基于物联网平台构建一个M2M设备间通信架构。智能灯与手机App的连接和通信...

JMeter个线程组的使用说明

当JMeter测试计划中存在个线程组,您需要了解如何结合JMeter和PTS配置参数,使个线程组并行或串行压测。前提条件 创建JMeter压测场景。具体操作,请参见 创建JMeter场景。背景信息 JMeter线程组包括setUp线程组、tearDown线程组和主线...

配置WAN

多WAN口组建高可用链路 一台智能接入网关设备支持配置多个WAN个WAN口可以组建高可用链路、实现端口流量的负载分担,提高网络的可用性。SAG-1000默认端口5为WAN口,您可以手动将SAG-1000其他端口分配为WAN口。SAG-100WM根据设备规格...

交换机开通IPv6

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 交换机的IPv...

安装并使用Deepnccl

Deepnccl是为阿里云神龙异构产品开发的用于GPU互联的AI通信加速库,能够无感地加速基于NCCL通信算子调用的分布式训练或多卡推理等任务。本文主要介绍在Ubuntu或CentOS操作系统的GPU实例上安装和使用Deepnccl的操作方法。前提条件 已创建...

网络最大传输单元MTU

理论上MTU越大,可在单个数据包中传递的数据越,网络通信越高效。本文介绍巨型帧相关功能以及如何修改ECS实例网卡的MTU。巨型帧(Jumbo frames)巨型帧是指有效负载超过IEEE 802.3标准所限制的1500字节的以太网帧,增大的有效载荷百分比...

注意事项

虽然在主控上用可序列化事务执行所有持久化数据库写入将确保所有后备将最终达到一个一致的状态,但是运行在后备上的一个可重复读事务有时可能会看到一个短暂的、与主控上事务的任何串行执行都不一致的状态。系统目录的内部访问不是...

智能接入网关硬件版FAQ

说明 如果主设备配置个WAN,备设备不支持建立隧道。智能接入网关设备双直挂场景下,主设备关机流量未切换至备设备,怎么处理?为您的智能接入网关示例配置HA。如果您配置的是通过静态路由接入上云,在智能接入网关控制台配置静态路由...

并行查询使用限制和兼容性问题

本文为您介绍并行查询的使用限制以及与串行执行结果可能不兼容的地方,帮助您正确使用并行查询功能。并行查询的使用限制 PolarDB 会持续迭代并行查询的能力,目前以下情况在并行计划中会有一定的局限性:查询非Innodb表,查询无法并行。...

网络规划

当您需要使用专有网络 VPC 和交换机来部署您的云上网络时,您可以结合具体的业务来规划 VPC、交换机的数量及IP地址的分配。同时还需要注意 VPC 与 VPC 或本地数据中心互通的要求。应该使用几个VPC?一个VPC 如果您没有地域部署系统的要求...
共有108条 < 1 2 3 4 ... 108 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 高速通道 短信服务 边缘网络加速 语音服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用