为LLM推理服务配置推理网关智能路由
传统的HTTP请求,经典负载均衡算法可以将请求均匀地发送给不同的工作负载。然而,对于LLM推理服务来说,每个请求给后端带来的负载是难以预测的。推理网关(Gateway with Inference Extension)是基于Kubernetes社区Gateway API及其Inference Extension规范实现的增强型组件,它能够通过智能路由优化在多个推理服务工作负载之间的负载均衡性能,根...
通过配置XFF请求头使ASM网关获得客户端IP
在营销、审计和反作弊等场景中,通常需要网关获取客户端源IP以提升安全性、优化体验或满足合规要求。本文介绍在ASM场景下,如何配置X-Forwarded-For请求头来使ASM网关获取客户端源IP。
在ASM入口网关上配置mTLS服务并限制特定客户端访问
ASM网关支持对外提供mTLS服务。mTLS协议要求客户端提供自身证书,证书中包含了用户的身份信息。您可以在授权策略中配置只有特定的用户才可以成功访问该服务,进而为服务提供更加高级别的保护。本文将介绍如何在ASM入口网关上配置mTLS服务,并且通过授权策略实现对特定用户的访问限制。
【Azure 事件中心】为应用程序网关(Application Gateway with WAF) 配置诊断日志,发送到事件中心
问题描述 在Application Gateway中,开启WAF(Web application firewall)后,现在需要把访问的日志输出到第三方分析代码中进行分析,如何来获取WAF的诊断日志呢? 整体方案的拓扑图如下: ...
简单明了!网关Gateway路由配置filters实现路径重写及对应正则表达式的解析
问题背景:前端需要发送一个这样的请求,但出现404首先解析请求的变化: http://www.51xuecheng.cn/api/checkcode/pic1.请求先打在nginx,www.51xuecheng.cn/api/checkcode/pic部分匹配到了之后会转发给网关进行处理变成localhost:63010/checkcode/pic 2.然后再转发到网关上,网关上的路由....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。