阿里云文档 2025-12-03

基于异构机密计算实例构建支持安全度量的大语言模型推理环境

随着大语言模型技术的普及,越来越多的企业开始尝试利用该技术来提升业务能力。因此,如何安全的管理模型及用户数据变得尤为重要,本文介绍基于异构机密计算实例构建支持安全度量大语言模型推理环境的最佳实践。

阿里云文档 2025-09-22

基于异构机密计算实例构建安全大语言模型推理环境

随着大语言模型技术的普及,企业对推理过程中的数据安全问题日益关注。本文将介绍如何基于阿里云异构机密计算实例及Confidential AI方案(以下简称CAI),快速构建安全的大语言模型推理环境。

文章 2025-09-11 来自:开发者社区

迈向可编程观测:在GPU Kernel中构建类eBPF风格的性能探针

引言 作为一名使用eBPF进行CPU性能分析的工程师,在转向学习GPU性能优化分析时,一直在思考GPU上是否有技术也可以实现用户自定义探针式性能分析?学习NVIDIA Nsight Compute过程中我发现,尽管它提供了丰富的硬件计数器和细粒度的性能指标,但是其数据采集范围和触发条件在 profiling 前由硬件或Metrics固定,用户可控程度有限。Nsight Compute虽然...

迈向可编程观测:在GPU Kernel中构建类eBPF风格的性能探针
阿里云文档 2025-06-09

使用ACS GPU算力构建Qwen3-32B模型推理服务

在使用容器计算服务 ACS(Container Compute Service)算力时,您无需深入了解底层硬件,也无需涉及GPU节点管理和配置即可开箱即用。ACS部署简单、支持按量付费,非常适合用于LLM推理任务,可以有效降低推理成本。本文介绍如何使用ACS GPU算力部署生产可用的Qwen3-32B模型推理服务。

阿里云文档 2025-05-13

使用ACS GPU算力构建QwQ-32B模型推理服务

在使用容器计算服务 ACS(Container Compute Service)算力时,您无需深入了解底层硬件,也无需涉及GPU节点管理和配置即可开箱即用。ACS部署简单、支持按量付费,非常适合用于LLM推理任务,可以有效降低推理成本。本文介绍如何使用ACS GPU算力部署生产可用的QwQ-32B模型推理服务,并通过Open WebUI页面进行展示。

阿里云文档 2025-03-14

使用ACS GPU算力构建分布式DeepSeek满血版推理服务

在使用容器计算服务 ACS(Container Compute Service)算力时,您无需深入了解底层硬件,也无需涉及GPU节点管理和配置即可开箱即用。ACS部署简单、支持按量付费,非常适合用于LLM推理任务,可以有效降低推理成本。DeepSeek-R1是一个参数量较大的模型,部分单机GPU无法支持完全加载或高效运行,因此我们推荐使用双容器实例部署方案以及多容器实例分布式推理部署方案,能够更好...

问答 2024-05-16 来自:开发者社区

容器镜像部署函数计算,如果部署在GPU实例上,那我构建的镜像还需要按照cuda吗?

容器镜像部署函数计算,如果部署在GPU实例上,那我构建的镜像还需要按照cuda吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注