阿里云文档 2025-10-23

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2025-09-22

使用Gateway with Inference Extension为SGLang PD分离服务配置推理路由

Prefill/Decode分离架构(PD分离),是当前主流的LLM推理优化技术,通过将LLM推理中的两个核心阶段解耦并分开部署在不同GPU上,避免资源争抢,从而显著降低TPOT,提升系统吞吐。本文以Qwen3-32B模型为例,演示如何通过Gateway with Inference Extension为部署在ACK中的SGLang PD分离架构模型推理服务。

阿里云文档 2025-09-10

使用AI网关代理ComfyUI服务

本文介绍如何使用AI网关代理ComfyUI服务。

阿里云文档 2025-08-07

通过ALB使用Gateway API暴露服务

Gateway API是Kubernetes官方项目,是下一代Kubernetes路由和负载均衡API,支持通过Gateway API配置流量规则。本文介绍如何通过ALB使用Gateway API来暴露服务至集群外部。

阿里云文档 2025-07-28

通过Gateway with Inference Extension访问服务

Gateway API是Kubernetes官方项目,是下一代Kubernetes路由和负载均衡API,支持通过Gateway API配置流量规则。本文介绍Gateway with Inference Extension支持的一些Gateway API基础能力配置方法。

文章 2024-08-19 来自:开发者社区

服务网关Gateway

前言 API 网关出现的原因是微服务架构的出现,不同的微服务一般会有不同的网络地址,而外部客户端可能需要调用多个服务的接口才能完成一个业务需求,如果让客户端直接与各个微服务通信,会有以下的问题: 破坏了服务无状态特点。 为了保证对外服务的安全性,我们需要实现对服务访问的权限控制,而开放服务的权限控制...

服务网关Gateway
文章 2024-06-25 来自:开发者社区

4.服务网关之Spring Cloud Gateway

1.Gateway–服务网关 1.1.网关简介 大家都知道在微服务结构中,一个系统会被拆分为很多个微服务。那么作为客户端要如何去调用,这么多的微服务呢? 如果没有网关的存在,我们只能在客户端记录每个微服务的地址,然后分别去调用。 ...

4.服务网关之Spring Cloud Gateway
问答 2024-06-14 来自:开发者社区

E-MapReduce Knox服务重启报错Gateway SSL Certificate i...

E-MapReduce Knox服务重启报错Gateway SSL Certificate is Expired

文章 2024-01-31 来自:开发者社区

springcloud5-服务网关zuul及gateway

1,课程回顾2,本章重点zuul(zuul1,zuul2)gateway3,具体内容3.1 zuul3.1.1 zuul简介https://www.springcloud.cc/https://github.com/Netflix/zuul/wikihttps://www.springcloud.cc/spring-cloud-greenwich.html#_router_and_filter_....

springcloud5-服务网关zuul及gateway
问答 2023-06-11 来自:开发者社区

下线或者关停服务,gateway的负载还是会分到已经关掉的服务里

网上有说是ribbon的定时任务更新可用服务列表导致的,无法及时更新可用服务, 这个是否有解决办法, 现在导致的问题是 无法无缝更新,需要去/actuator/service-registry?status=DOWN 接口先注销掉服务才能优雅关停服务 类似eureka(请求注销+sleep) 无法使用nacos的秒级切换上下线 ,正常关停服务也是,是否nacos支付其他方式 来优雅关停服务 原提....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注