阿里云文档 2026-03-06

使用TensorRT-LLM构建模型的推理环境

在GPU的实例上安装推理引擎TensorRT-LLM,可以帮助您快速且方便地构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析等自然语言处理业务场景。本文为您介绍如何在GPU实例上安装和使用TensorRT-LLM来快速构建大语言模型的高性能推理优化功能。

阿里云文档 2025-12-12

ECS实例网络存储带宽配置功能支持按需调整网络与EBS存储带宽,适用于特定规格实例,调整后总带宽不变但可能间接影响IOPS性能。

ECS实例网络与存储带宽配置功能,允许根据业务负载需求,调整ECS实例的网络带宽和存储带宽。

文章 2025-10-24 来自:开发者社区

阿里云服务器五代至九代实例规格详解及性能提升对比,场景适配与选择指南参考

目前阿里云服务器的实例规格经过多次升级之后,最新一代已经升级到第九代实例,当下主售的云服务器实例规格也以八代和九代云服务器为主,对于初次接触阿里云服务器实例规格的用户来说,可能并不是很清楚阿里云服务器五代、六代、七代、八代、九代实例有哪些,他们之间有何区别,下面小编为大家介绍下阿里云五代到九代云服务器实例规格分别...

阿里云服务器五代至九代实例规格详解及性能提升对比,场景适配与选择指南参考
阿里云文档 2025-09-24

规避Split Lock性能争抢最佳实践

Intel CPU架构支持不对齐的内存访问。Intel将跨缓存行(cache line)的原子操作称为Split Lock。在并发或高性能计算场景中,频繁的Split Lock会影响系统性能,并可能导致系统卡顿或崩溃。

阿里云文档 2025-07-11

性能风险事件通知

当实例的CPU、存储以及网络性能达到实例规格上限或者实例的连通性存在异常时,阿里云会发送实例性能风险事件通知。

文章 2025-07-09 来自:开发者社区

阿里云服务器热门实例选择指南:经济型/通用型/计算型性能解析与场景适配

当我们通过阿里云的活动选购云服务器时,常常会面临一个令人困惑的选择:相同配置的云服务器,为何存在多个不同的实例类型,且价格差异显著。例如同样是4核8G配置,现在购买选择经济型e实例价格为1595.11元起,选择通用算力型u1实例价格为955.58元起,选择计算型c9i实例价格是3136.81元起&#...

阿里云服务器热门实例选择指南:经济型/通用型/计算型性能解析与场景适配

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注