功能发布记录

2022年11月 更新事项 描述 AI Earth 地球科学云平台正式发布 平台集公开数据检索、在线处理分析(工具箱模式+开发者模式)、遥感AI模型训练为一体,为广大科研用户和政企用户提供便捷高效的一式遥感云计算服务。2022年08月 更新事项 描述...

安装ACCL库

ACCL(Alibaba Collective Communication Library)是一款高性能通信库,提供了AllReduce、AllToAllV、Broadcast等常用集合操作接口以及点到点Send/Recv接口,为多机多卡训练提供高效的通信支持。本文为您介绍如何安装ACCL库。背景信息 ...

建立gRPC连接

gRPC具有高性能的特点,能有效减少带宽使用、降低网络延迟。gRPC的 作用与 优势 高效通信:利用HTTP/2的多路复用特性,gRPC能够在一个TCP连接上并发执行多个请求,提高了通信效率和性能。跨语言互操作性:gRPC支持多种主流编程语言,允许...

网络优化

ECS网络性能优化 在用户业务的网络密集型应用场景中,例如 NFV/SD-WAN、转发网元业务、视频弹幕等,ECS 单实例的性能容量至关重要,随着阿里云软硬件一体的虚拟交换机技术的研发和深化,在ECS第7代网络增强型实例中,依托第四代神龙架构,...

使用IMB软件和MPI通信库测试集群通信性能

本文以IMB软件和MPI通信库为例介绍如何测试E-HPC集群的通信性能。背景信息 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言编程的并行计算...

什么是AI通信加速库Deepnccl

Deepnccl是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍Deepnccl的架构、优化原理和性能说明。产品简介 Deepnccl基于NCCL(NVIDIA Collective ...

Node应用内存泄漏分析方法论与实战

注:本文为第12届D2前端技术论坛《打造高可靠与高性能的React同构解决方案》分享内容,已经过数据脱敏处理。本文发表于 北斗同构github,转载请注明出处。菜鸟物流大市场是菜鸟旗下的一条业务线,可以简单地理解为物流领域的淘宝,是为撮合...

网络

功能介绍 配置项 功能描述 IPv6访问 IPv4的网络地址资源不足严重制约了互联网的发展,而IPv6的引入使得该问题得以解决,阿里云 全加速 DCDN 长期致力于互联网技术的健康、可持续发展。我们默认为您的站点免费开启IPv6服务,客户端可根据...

什么是Deepytorch Training(训练加速)

产品优势 训练性能显著提升 Deepytorch Training通过整合分布式通信和计算图编译的性能特点,可以实现端到端训练性能的显著提升,使得模型训练迭代速度更快,不仅减少了资源的使用成本,还缩短了迭代的时间成本,为您带来低成本体验。...

设备接入引导

SL 651:建议采用TLS方式接入,支持使用服务端单向认证、设备端和服务端证书OCSP能力、设备和服务端双向安全认证等能力,适用于遥测设备与阿里云企业物联网平台之间的通信,用于水文监测数据采集与传输。云端开发流程如下:接入中国电信...

并发用户、RPS、TPS的解读

如何评价系统的性能 针对服务器端的性能,以TPS为主来衡量系统的性能,并发用户数为辅来衡量系统的性能,如果必须要用并发用户数来衡量的话,需要一个前提,那就是交易在多长时间内完成,因为在系统负载不高的情况下,将思考时间(思考时间...

ECS系统事件汇总

Stalled 磁盘性能受到严重影响 严重 Disk:Stalled:Executing:磁盘性能开始受到严重影响 Disk:Stalled:Executed:磁盘性能受到严重影响已恢复 当阿里云识别到ECS实例所挂载云盘出现IO夯,导致云盘性能受到严重影响,无法进行正常读写时,...

2.0和3.0版本差异及兼容性说明

性能测试 PTS(Performance Testing Service)是一款简单易用,具备强大的分布式压测能力的SaaS压测平台。随着PTS 3.0版本的发布,性能测试 PTS将为您提供更加稳定可靠、更具洞察力的3.0版本。本文介绍3.0版本和2.0版本的差异及兼容性说明...

发布日志

V1.17.45@2021-04-13 修复内存踩导致崩溃的问题。V1.17.44@2021-04-02 修复日志命名异常导致的崩溃问题。V1.17.43@2021-03-29 优化音频3A。V1.17.42@2021-03-23 支持播放和渲染双声道音频。V1.17.41@2021-02-26 新增角色鉴权功能,用户可...

控制面核心组件

Pilot 落地实践 在开始落地实践部分之前,先引入 Istio 的架构图:出于性能等方面的综合考虑,在落地过程中,蚂蚁团队将控制面的组件精简为 Pilot 和 Citadel 两个组件,不使用因性能问题争议不断的 Mixer,不引入 Galley 来避免多一跳的...

基于eRDMA增强型实例部署AI训练集群

在NCCL底层通信链接上,有多种不同的传输方式,例如单机内部多卡P2P通信以及多机上的传统socket通信(如VPC网络)和高性能的InfiniBand(IB)通信,其中eRDMA是一种基于RDMA的传输方式,具有极低的延迟,并且在性能上接近RDMA网络的优势。...

发布日志

优化屏幕共享功能,提升弱网和低性能设备的可用性。修复因GRTN(Tenfold)协议切网或断网引起公网IP、端口变化,从而导致重推功能异常的问题。V2.4.1@2021-06-17 优化推流时预览视频画面自适应屏幕旋转功能。音频场景增加CHATROOM(语聊)...

功能发布记录(2.0)

优化屏幕共享功能,提升弱网和低性能设备的可用性。修复因GRTN(Tenfold)协议切网或断网引起公网IP、端口变化,从而导致重推功能异常的问题。V2.4.1@2021-06-17 优化推流时预览视频画面自适应屏幕旋转功能。音频场景增加CHATROOM(语聊)...

通信消息相关问题

本文介绍设备与物联网平台和物联网平台与服务器端的通信相关问题和解决方法。类目 问题 上下行消息 设备重复收到消息,如何去重?设备使用MQTT协议接入物联网平台后,接收不到通信数据,怎么办?物联网平台发送消息比较慢,存在超时情况,...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC-ACSpeed优化原理 场景说明 使用单机多卡或多机多卡进行AI分布式训练时,分布式通信的线性度可作为单卡训练扩展到多卡的性能指标,线性度的计算方式如下:单机内部扩展性:线性度=多卡性能/单卡性能/单机卡数 多机之间扩展性:线性度=...

eRDMA

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA),是阿里云提供的低延迟、大吞吐、高弹性的高性能RDMA网络服务。eRDMA的能力实现需要基于支持eRDMA能力的实例规格,创建挂载支持弹性RDMA能力的网卡,才能够实现具有大规模RDMA...

eRDMA概述

众多应用都是基于TCP/IP构建的,但随着数据中心相关的业务蓬勃发展,应用对于网络的性能需求(如延迟、吞吐)越来越高,受限于TCP/IP的局限性(如拷贝开销大、协议栈处理厚、CC算法复杂、上下文切换频繁等),TCP/IP的网络通信性能已经成为...

功能特性

灵骏满足AI、HPC等计算密集场景需要的高性能算力,可实现高性能、大规模的池化算力,满足自动驾驶、科研、金融、生物制药等多行业的异构算力需求。本文为您介绍灵骏的功能特性。高速RDMA网络架构 阿里巴巴2016年开始投入专项研究RDMA...

PAI灵骏智算服务概述

PAI灵骏 是一种大规模高密度计算服务,全称“PAI灵骏智算服务”,提供高性能AI训练、高性能计算所需的异构计算算力服务。PAI灵骏 主要面向图形图像识别、自然语言处理、搜索广告推荐、通用大模型等大规模分布式的AI研发场景,适用于自动...

搭建高性能网络ACK集群

阿里云托管版容器服务ACK集群,支持自研的Terway网络插件,该插件可以有效减少因容器而引入的网络性能下降,可以基本达到服务器之间直接通信的网络性能。本最佳实践主要是一个性能测试方面的实践,指导客户进行POC测试等。解决问题 Pod之间...

分布式通信框架gRPC+

gRPC+通过Sharing Nothing架构、BusyPolling机制、用户态零拷贝及Send/Recv融合等多种优化技术,降低了E2E的通信延时,提高了Server的吞吐能力,从而可以支持更大的训练规模和训练性能。针对典型业务场景,其训练性能比原生TensorFlow提升...

概述

性能度量了系统在单元环境内承载工作负载的效率,系统性能通常可以由 QPS、并发和RT(响应时间)等典型指标来衡量。在传统 IT 环境中,系统的容量评估和规划是系统设计的重要环节,通常会基于系统对峰值负载表现出来的性能承载能力来给系统...

性能

云数据库RDS提供高性能实例,包括参数优化、SQL优化建议等...性能白皮书 RDS MySQL性能白皮书 RDS SQL Server性能白皮书 RDS PostgreSQL性能白皮书 开始使用RDS 快速入门 学习路径图 相关文档 RDS产品选型 自建数据库与RDS性能对比的注意事项

AIACC-ACSpeed性能数据

相比较通过原生DDP训练模型后的性能数据,使用AIACC-ACSpeed训练多个模型时,性能具有明显提升。本文为您展示了AIACC-ACSpeed的部分典型模型的训练性能数据。测试版本 ACSpeed版本:1.0.2 Cuda版本:11.1 torch版本:1.8.1+cu111 实例类型...

网络最大传输单元MTU

重要 对于超过链路最大MTU限制的数据包,阿里云转发组件会依据RFC标准对报文进行分片或协商,但是这只能保证连通性,不能保证网络通信性能。因此在链路最大MTU为1500的通信场景下,尽量避免使用巨型帧进行UDP、ICMP通信。对于阿里云上...

查询网络通信距离(NCD)

PAI灵骏提供了统一的网络通信距离NCD(Network Communication Distance)查询接口,供您对GPU节点(或网卡)间的通信距离进行查询,以实现更优的任务调度,获得最佳的训练性能。本文为您介绍NCD的基本概念、使用NCD的原因以及如何使用NCD。...

实践教程概览

使用IMB软件和MPI通信库测试E-HPC通信性能 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言的并行计算通信库,具有高性能、大规模性、可移植...

性能监控概述

场景 单机性能采集 持续性能采集 对比某服务在测试环境与生产环境的性能差异 不支持 支持 对比某服务版本1.0与版本2.0的性能差异 不支持 支持 对比某服务在ARM服务器与AMD服务器的性能差异 不支持 支持 对比某服务在北京地域与杭州地域服务...

如何发起MQTT亿级连接和千万消息吞吐性能测试

大量设备接入和设备管理对网络带宽、通信协议以及平台服务架构都带来了很大挑战。如何做好以MQTT为代表的物联网协议性能测试显得尤为重要。本文则介绍如何使用阿里云性能测试PTS对MQTT协议进行性能压测。进行MQTT性能测试可以帮助您实现...

使用高性能容器应用

通过高性能容器应用,您可以在E-HPC集群上通过高性能容器应用启动高性能计算作业,从而降低业务部署的复杂性。高性能容器应用在支持E-HPC全部原有能力(如弹性伸缩、性能监控等)的基础上,可为您提供更加高效和便捷的计算解决方案。本文...

地球球体层

本文介绍 地球球体层 的图标样式和各配置项的含义。图表样式 地球球体层是3D球形地图的子组件,支持自定义地球贴图和大气层配置。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您需要搜索的配置项名称,...

阿里云云通信短信服务安全白皮书V1.0

【声明】本安全白皮书著作权归阿里巴巴云计算(北京)有限公司所有(以下简称阿里云云通信),未经阿里云云通信事先书面许可,任何主体不得以任何形式复制、修改、传播全部或部分内容。本白皮书仅供参考,对于本文档中的信息,阿里云云通信...

测试分析及调优

本文通过编写性能测试分析及调优的相关流程和方法,帮助研发人员、性能测试人员或者运维人员快速地进行性能测试、瓶颈定位及调优。系统的性能是由很多因素决定的,本文很难面面俱到,但是可以作为分析系统性能的一个指导。适用对象和范围 ...

产品优势

相较于其他HPC集群,阿里云弹性高性能计算E-HPC产品具有灵活部署、弹性资源、数据安全、高可用性、结果可视等特点。弹性高性能计算E-HPC的优势 灵活部署 您可以在E-HPC控制台快速创建高性能计算集群。一键部署需要的高性能计算环境和应用...

性能参数模板

本章节详细介绍 PolarDB MySQL版 支持的高性能参数模板中的参数设置情况,以及如何开启高性能参数模板和开启高性能模板前后的性能提升情况。高性能参数模板简介 由于PolarDB的参数比较多,针对特定场景进行参数适配的学习成本比较高。为了...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 物联网无线连接服务 边缘网络加速 短信服务 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用