阿里云文档 2026-03-06

使用TensorRT-LLM构建模型的推理环境

在GPU的实例上安装推理引擎TensorRT-LLM,可以帮助您快速且方便地构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析等自然语言处理业务场景。本文为您介绍如何在GPU实例上安装和使用TensorRT-LLM来快速构建大语言模型的高性能推理优化功能。

阿里云文档 2025-12-12

ECS实例网络存储带宽配置功能支持按需调整网络与EBS存储带宽,适用于特定规格实例,调整后总带宽不变但可能间接影响IOPS性能。

ECS实例网络与存储带宽配置功能,允许根据业务负载需求,调整ECS实例的网络带宽和存储带宽。

文章 2025-09-28 来自:开发者社区

阿里云轻量应用服务器2核2G38元1年起怎么样?性能、应用场景与购买价值参考

目前在阿里云的活动中,抢购价为38元1年的轻量应用服务器受到了众多个人和中小企业用户的高度关注,该款轻量应用服务器置为2核CPU、2G内存,峰值带宽达200M。那么,此款轻量应用服务器的具体性能如何?适用于哪些应用场景?是否具备较高的购买价值?本文将针对这款特惠轻量应用服务器展开全面且深入的测评与介...

阿里云轻量应用服务器2核2G38元1年起怎么样?性能、应用场景与购买价值参考
阿里云文档 2025-09-24

规避Split Lock性能争抢最佳实践

Intel CPU架构支持不对齐的内存访问。Intel将跨缓存行(cache line)的原子操作称为Split Lock。在并发或高性能计算场景中,频繁的Split Lock会影响系统性能,并可能导致系统卡顿或崩溃。

阿里云文档 2025-07-11

性能风险事件通知

当实例的CPU、存储以及网络性能达到实例规格上限或者实例的连通性存在异常时,阿里云会发送实例性能风险事件通知。

文章 2024-11-21 来自:开发者社区

阿里云GPU云服务器性能、应用场景及收费标准和活动价格参考

GPU云服务器作为阿里云提供的一种高性能计算服务,通过结合GPU与CPU的计算能力,为用户在人工智能、高性能计算等领域提供了强大的支持。其具备覆盖范围广、超强计算能力、网络性能出色等优势,且计费方式灵活多样,能够满足不同用户的需求。目前用户购买阿里云gpu云服务器gn5 规格族(P100-16G)、gn6i 规格...

阿里云GPU云服务器性能、应用场景及收费标准和活动价格参考

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注