阿里云文档 2026-03-06

使用TensorRT-LLM构建模型的推理环境

在GPU的实例上安装推理引擎TensorRT-LLM,可以帮助您快速且方便地构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析等自然语言处理业务场景。本文为您介绍如何在GPU实例上安装和使用TensorRT-LLM来快速构建大语言模型的高性能推理优化功能。

阿里云文档 2025-12-12

ECS实例网络存储带宽配置功能支持按需调整网络与EBS存储带宽,适用于特定规格实例,调整后总带宽不变但可能间接影响IOPS性能。

ECS实例网络与存储带宽配置功能,允许根据业务负载需求,调整ECS实例的网络带宽和存储带宽。

文章 2025-10-23 来自:开发者社区

阿里云服务器ESSD AutoPL、ESSD和ESSD Entry云盘解析:应用场景、性能差异与选择指南

云盘作为阿里云为云服务器ECS所提供的数据块级存储产品,采用分布式三副本机制,为ECS实例提供高达99.9999999%的数据可靠性保障。在阿里云服务器可选的云盘类型中,ESSD AutoPL、ESSD和ESSD Entry云盘占据主导地位。然而,部分用户对于这三者之间的区别并不是很清楚。这些差异主要体现在目标应用场景、性能级别以及成本效益...

阿里云服务器ESSD AutoPL、ESSD和ESSD Entry云盘解析:应用场景、性能差异与选择指南
阿里云文档 2025-09-24

规避Split Lock性能争抢最佳实践

Intel CPU架构支持不对齐的内存访问。Intel将跨缓存行(cache line)的原子操作称为Split Lock。在并发或高性能计算场景中,频繁的Split Lock会影响系统性能,并可能导致系统卡顿或崩溃。

阿里云文档 2025-07-11

性能风险事件通知

当实例的CPU、存储以及网络性能达到实例规格上限或者实例的连通性存在异常时,阿里云会发送实例性能风险事件通知。

文章 2024-11-06 来自:开发者社区

阿里云服务器操作系统 Alibaba Cloud Linux 全新升级,核心场景性能提升超 20%

以下内容转载自中国网: 9 月 20 日,2024 云栖大会上,面向“云+AI”应用场景,阿里云服务器操作系统 Alibaba Cloud Linux(简称 Alinux)实现全面升级。作为中国云上规模第一的服务器操作系统,阿里云服务器操作系统基于“一云多芯”实现软硬件协同优化,CPU、GPU 资源利用率大幅提高,在数据库等核心场景的性能全平台提升 20% 以上,并支持多种主流...

阿里云服务器操作系统 Alibaba Cloud Linux 全新升级,核心场景性能提升超 20%

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注