阿里云文档 2025-04-29

使用ACK Gateway with Inference Extension实现智能路由与流量管理

针对Kubernetes集群中的LLM推理服务,经典负载均衡方法往往基于简单的流量分配,无法处理LLM推理过程中的复杂请求和动态流量负载。本文介绍如何使用ACK Gateway with Inference Extension组件配置推理服务扩展,以实现智能路由和高效流量管理。

阿里云文档 2025-04-27

在ACK托管集群(智能托管模式)中部署工作负载并实现负载均衡

本文介绍如何在ACK托管集群(智能托管模式)中部署一个工作负载,并通过ALB Ingress实现公网访问。完成后,您可以通过设定的域名访问该应用,实现外部流量的高效管理和负载均衡。

阿里云文档 2025-04-25

使用ACK Gateway with Inference Extension实现推理服务的请求熔断

ACK Gateway with Inference Extension组件支持在开启推理服务智能负载均衡的同时配置熔断规则。当服务出现异常时,熔断机制可以自动切断有问题的服务连接,防止故障蔓延。本文介绍如何使用ACK Gateway with Inference Extension为推理服务配置流量熔断规则。

阿里云文档 2025-04-22

使用ACK Gateway with Inference Extension实现推理服务的流量镜像

ACK Gateway with Inference Extension组件在支持推理服务智能负载均衡的同时,也支持推理请求的流量镜像功能。在生产环境中部署新推理模型时,您可以通过流量镜像复制生产流量来评估新模型的表现,确保其性能和稳定性符合要求之后再正式上线。本文介绍如何使用ACK Gateway with Inference Extension来实现推理请求的流量镜像。

阿里云文档 2025-04-22

使用ACK Gateway with Inference Extension实现智能路由与流量管理

针对Kubernetes集群中的LLM推理服务,经典负载均衡方法往往基于简单的流量分配,无法处理LLM推理过程中的复杂请求和动态流量负载。本文介绍如何使用ACK Gateway with Inference Extension组件配置推理服务扩展,以实现智能路由和高效流量管理。

问答 2024-08-28 来自:开发者社区

阿里云容器服务ACK的智能化升级如何降低容器技术的使用门槛?

阿里云容器服务ACK的智能化升级如何降低容器技术的使用门槛?

问答 2022-04-03 来自:开发者社区

一个虚拟机中智能运行一个容器吗?

一个虚拟机中智能运行一个容器吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注