阿里云文档 2026-03-06

使用TensorRT-LLM构建模型的推理环境

在GPU的实例上安装推理引擎TensorRT-LLM,可以帮助您快速且方便地构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析等自然语言处理业务场景。本文为您介绍如何在GPU实例上安装和使用TensorRT-LLM来快速构建大语言模型的高性能推理优化功能。

阿里云文档 2025-12-12

ECS实例网络存储带宽配置功能支持按需调整网络与EBS存储带宽,适用于特定规格实例,调整后总带宽不变但可能间接影响IOPS性能。

ECS实例网络与存储带宽配置功能,允许根据业务负载需求,调整ECS实例的网络带宽和存储带宽。

文章 2025-10-17 来自:开发者社区

阿里云服务器实例规格选型解析:不同类型实例的性能特点、匹配场景与选型策略参考

如何挑选阿里云服务器实例规格?不同类型的实例规格在性能特点和适用场景以及收费标准方面都不一样,在挑选阿里云服务器实例规格时,需考量诸多因素,涵盖应用需求、性能要求以及预算限制等。对于初次选购阿里云服务器的用户来说,新手用户可能不知道如何根据自己的需求、预算等情况选择适合自己的云服务器实例。本文将从实例规格的分类、选择教程以及经...

阿里云服务器实例规格选型解析:不同类型实例的性能特点、匹配场景与选型策略参考
阿里云文档 2025-09-24

规避Split Lock性能争抢最佳实践

Intel CPU架构支持不对齐的内存访问。Intel将跨缓存行(cache line)的原子操作称为Split Lock。在并发或高性能计算场景中,频繁的Split Lock会影响系统性能,并可能导致系统卡顿或崩溃。

阿里云文档 2025-07-11

性能风险事件通知

当实例的CPU、存储以及网络性能达到实例规格上限或者实例的连通性存在异常时,阿里云会发送实例性能风险事件通知。

问答 2024-08-13 来自:开发者社区

当前试用的服务器类型及具体性能怎么看?

当前试用的服务器类型及具体性能怎么看?

问答 2022-02-15 来自:开发者社区

为什么购买ecs服务器时类型不能选择,只能选择突发性能的,而我需要的是内存型的

为什么购买ecs服务器时类型不能选择,只能选择突发性能的,而我需要的是内存型的不能选择

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注