文章 2025-04-16 来自:开发者社区

ACK Gateway with Inference Extension:优化多机分布式大模型推理服务实践

【阅读原文】戳:ACK Gateway with Inference Extension:优化多机分布式大模型推理服务实践 ACK Gateway with Inference Extension组件专为LLM推理场景设计,支持四层/七层流量路由,并提供基于模型服务器负载智能感知的负载均衡能力。此外,通过InferencePool和InferenceModel自定义资...

ACK Gateway with Inference Extension:优化多机分布式大模型推理服务实践
文章 2025-03-18 来自:开发者社区

ACK Gateway with AI Extension:大模型推理的模型灰度实践

【阅读原文】戳:ACK Gateway with AI Extension:大模型推理的模型灰度实践 ACK Gateway with AI Extension组件专为LLM推理场景设计,支持四层/七层流量路由,并提供基于模型服务器负载智能感知的负载均衡能力。此外,通过InferencePool和InferenceModel自定义资源(CRD),可以灵活定义推理服务的...

ACK Gateway with AI Extension:大模型推理的模型灰度实践
文章 2025-03-17 来自:开发者社区

ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践

【阅读原文】戳:ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践 在当今大语言模型(LLM)推理场景中,Kubernetes已经成为LLM推理服务部署不可获取的基础设施,但在LLM流量管理方面、由于LLM推理服务和推理流量的特殊性,传统的负载均衡和路由调度算法已难以满足该类服务的高性能、高可靠性需求。阿里云容...

ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践
文章 2025-02-28 来自:开发者社区

基于阿里云容器服务(ACK)的微服务架构设计与实践

基于阿里云容器服务(ACK)的微服务架构设计与实践 随着云原生技术的快速发展,微服务架构已成为构建现代化分布式应用的主流选择。阿里云容器服务 Kubernetes 版(ACK)提供了强大的容器编排能力,帮助企业高效构建、部署和管理微服务应用。本文将深入探讨如何基于阿里云ACK设计和实现一个高可用、可扩展的微服务架...

文章 2025-02-26 来自:开发者社区

基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践

在云原生技术的浪潮中,无服务器架构(Serverless Architecture)逐渐成为开发者关注的焦点。无服务器架构的核心思想是将基础设施的管理完全交给云平台,开发者只需专注于业务逻辑的实现,而无需关心服务器的运维、扩展和容量规划。阿里云Serverless Kubernetes(ASK)正是...

文章 2025-02-26 来自:开发者社区

基于阿里云容器服务Kubernetes版(ACK)的微服务架构设计与实践

引言 随着云计算技术的快速发展,云原生(Cloud Native)已经成为现代应用开发的主流趋势。云原生不仅仅是一种技术,更是一种构建和运行应用程序的方法论。它强调利用云计算的优势,如弹性、可扩展性和自动化,来加速应用的开发、部署和运维。阿里云作为国内领先的云服务提供商,提供了丰富的云原生服务&#x...

文章 2024-12-11 来自:开发者社区

阿里云ACK容器服务生产级可观测体系建设实践

本文整理自2024云栖大会冯诗淳演讲 大家好,我是阿里云容器服务团队可观测负责人:冯诗淳,花名:行疾。我将会为大家带来分享《阿里云ACK容器服务生产级可观测体系建设实践》 ...

阿里云ACK容器服务生产级可观测体系建设实践
文章 2024-12-11 来自:开发者社区

阿里云容器服务 ACK One 分布式云容器企业落地实践

阿里云容器服务ACK提供丰富的产品功能,在弹性、调度、可观测、成本治理、安全合规方面提供强大且成熟的产品能力,但如果您有IDC资源或者三方资源,无法短期迁移到阿里云容器服务ACK,又有弹性、调度、可观测、成本治理、安全等方面的痛点,可以考虑采用ACK  One分布式云容器平台。 3年前的云栖大会,我们发布分布式云容器平台ACK One,随着3年的发展,很高兴看到ACK...

阿里云容器服务 ACK One 分布式云容器企业落地实践
文章 2024-11-20 来自:开发者社区

Kubernetes集群的高可用性与伸缩性实践

Kubernetes(K8s)作为云原生应用的基石,其高可用性和伸缩性对于保障应用的稳定运行和应对流量高峰至关重要。本文将介绍如何构建高可用性与伸缩性的Kubernetes集群,包括节点高可用、Pod高可用、自动伸缩以及监控与告警等关键方面。 正文: 引言Kubernetes集群的高可用性和伸缩性是保障云原生应用稳定运行的重要...

文章 2024-11-16 来自:开发者社区

深入云原生:Kubernetes 集群部署与管理实践

在当今这个信息爆炸的时代,企业对于IT系统的要求越来越高,他们需要的是能够快速响应市场变化、易于扩展和维护的系统。云原生技术,特别是基于容器的解决方案如Kubernetes,提供了这样的能力。Kubernetes不仅能够自动化应用程序的部署、扩展和管理,还能保证应用的高可用性和负载均衡。 首先,我们需要准备适合K...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注