阿里云文档 2026-03-06

使用TensorRT-LLM构建模型的推理环境

在GPU的实例上安装推理引擎TensorRT-LLM,可以帮助您快速且方便地构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析等自然语言处理业务场景。本文为您介绍如何在GPU实例上安装和使用TensorRT-LLM来快速构建大语言模型的高性能推理优化功能。

阿里云文档 2025-12-12

ECS实例网络存储带宽配置功能支持按需调整网络与EBS存储带宽,适用于特定规格实例,调整后总带宽不变但可能间接影响IOPS性能。

ECS实例网络与存储带宽配置功能,允许根据业务负载需求,调整ECS实例的网络带宽和存储带宽。

文章 2025-10-17 来自:开发者社区

阿里云服务器实例规格选型解析:不同类型实例的性能特点、匹配场景与选型策略参考

如何挑选阿里云服务器实例规格?不同类型的实例规格在性能特点和适用场景以及收费标准方面都不一样,在挑选阿里云服务器实例规格时,需考量诸多因素,涵盖应用需求、性能要求以及预算限制等。对于初次选购阿里云服务器的用户来说,新手用户可能不知道如何根据自己的需求、预算等情况选择适合自己的云服务器实例。本文将从实例规格的分类、选择教程以及经...

阿里云服务器实例规格选型解析:不同类型实例的性能特点、匹配场景与选型策略参考
阿里云文档 2025-09-24

规避Split Lock性能争抢最佳实践

Intel CPU架构支持不对齐的内存访问。Intel将跨缓存行(cache line)的原子操作称为Split Lock。在并发或高性能计算场景中,频繁的Split Lock会影响系统性能,并可能导致系统卡顿或崩溃。

阿里云文档 2025-07-11

性能风险事件通知

当实例的CPU、存储以及网络性能达到实例规格上限或者实例的连通性存在异常时,阿里云会发送实例性能风险事件通知。

文章 2025-03-26 来自:开发者社区

阿里云服务器ECS通用型规格族解析:实例规格、性能基准与场景化应用指南

作为ECS产品矩阵中的核心序列,通用型规格族以均衡的计算、内存、网络和存储性能著称,覆盖从基础应用到高性能计算的广泛场景。通用型规格族属于独享型云服务器,实例采用固定CPU调度模式,实例的每个CPU绑定到一个物理CPU超线程,实例间无CPU资源争抢,实例计算性能稳定且有严格的SLA保证,在性能上会更...

阿里云服务器ECS通用型规格族解析:实例规格、性能基准与场景化应用指南
文章 2022-02-17 来自:开发者社区

阿里云服务器通用型实例规格g6性能配置适用场景详细讲解

g6的特点:依托神龙架构,将大量虚拟化功能卸载到专用硬件,降低虚拟化开销,提供稳定可预期的超高性能I/O优化实例支持ESSD云盘、SSD云盘和高效云盘说明 不同实例规格族的云盘性能上限不同,单台g6实例最高支持20万IOPS。如果需要更高的存储I/O性能,建议您选用g5se,详细信息请参见存储增强型实例规格族g5se。实例存储I/O性能与计算规格对应(规格越高存储I/O性能越强)处理器与内存配比....

阿里云服务器通用型实例规格g6性能配置适用场景详细讲解

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注