阿里云文档 2026-03-06

使用TensorRT-LLM构建模型的推理环境

在GPU的实例上安装推理引擎TensorRT-LLM,可以帮助您快速且方便地构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析等自然语言处理业务场景。本文为您介绍如何在GPU实例上安装和使用TensorRT-LLM来快速构建大语言模型的高性能推理优化功能。

阿里云文档 2025-12-12

ECS实例网络存储带宽配置功能支持按需调整网络与EBS存储带宽,适用于特定规格实例,调整后总带宽不变但可能间接影响IOPS性能。

ECS实例网络与存储带宽配置功能,允许根据业务负载需求,调整ECS实例的网络带宽和存储带宽。

文章 2025-10-17 来自:开发者社区

阿里云服务器实例规格选型解析:不同类型实例的性能特点、匹配场景与选型策略参考

如何挑选阿里云服务器实例规格?不同类型的实例规格在性能特点和适用场景以及收费标准方面都不一样,在挑选阿里云服务器实例规格时,需考量诸多因素,涵盖应用需求、性能要求以及预算限制等。对于初次选购阿里云服务器的用户来说,新手用户可能不知道如何根据自己的需求、预算等情况选择适合自己的云服务器实例。本文将从实例规格的分类、选择教程以及经...

阿里云服务器实例规格选型解析:不同类型实例的性能特点、匹配场景与选型策略参考
阿里云文档 2025-09-24

规避Split Lock性能争抢最佳实践

Intel CPU架构支持不对齐的内存访问。Intel将跨缓存行(cache line)的原子操作称为Split Lock。在并发或高性能计算场景中,频繁的Split Lock会影响系统性能,并可能导致系统卡顿或崩溃。

阿里云文档 2025-07-11

性能风险事件通知

当实例的CPU、存储以及网络性能达到实例规格上限或者实例的连通性存在异常时,阿里云会发送实例性能风险事件通知。

文章 2025-06-10 来自:开发者社区

阿里云服务器通用型实例解析:g7/g8a/g8y/g8i性能对比与场景化选型参考

在阿里云服务器的通用型实例规格中,通用型g7、通用型g8a、通用型g8y和通用型g8i,凭借其强大的性能和灵活的配置,成为了众多企业和开发者的首选。这几个实例规格相比经济型e和通用算力型u1等实例规格,性能更为强劲,尽管它们的处理器与内存配比通常为1:4,但在处理器架构、存储能力、网络性能及安全特性等方面各有千秋...

阿里云服务器通用型实例解析:g7/g8a/g8y/g8i性能对比与场景化选型参考
文章 2025-03-26 来自:开发者社区

阿里云服务器ECS通用型规格族解析:实例规格、性能基准与场景化应用指南

作为ECS产品矩阵中的核心序列,通用型规格族以均衡的计算、内存、网络和存储性能著称,覆盖从基础应用到高性能计算的广泛场景。通用型规格族属于独享型云服务器,实例采用固定CPU调度模式,实例的每个CPU绑定到一个物理CPU超线程,实例间无CPU资源争抢,实例计算性能稳定且有严格的SLA保证,在性能上会更...

阿里云服务器ECS通用型规格族解析:实例规格、性能基准与场景化应用指南

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注