阿里云文档 2025-04-18

使用ACK Gateway with Inference Extension实现智能路由与流量管理

针对Kubernetes集群中的LLM推理服务,经典负载均衡方法往往基于简单的流量分配,无法处理LLM推理过程中的复杂请求和动态流量负载。本文介绍如何使用ACK Gateway with Inference Extension组件配置推理服务扩展,以实现智能路由和高效流量管理。

阿里云文档 2025-04-11

在ACK托管集群(智能模式)中部署工作负载并实现负载均衡

本文介绍如何在ACK托管集群(智能模式)中部署一个工作负载,并通过ALB Ingress实现公网访问。完成后,您可以通过设定的域名访问该应用,实现外部流量的高效管理和负载均衡。

文章 2025-03-08 来自:开发者社区

使用容器服务ACK快速部署QwQ-32B模型并实现推理智能路由

【阅读原文】戳:使用容器服务ACK快速部署QwQ-32B模型并实现推理智能路由 背景介绍     1. QwQ-32B模型 阿里云最新发布的QwQ-32B模型,通过强化学习大幅度提升了模型推理能力。QwQ-32B模型拥有320亿参数,其性能可以与DeepSeek-R1 671B媲美。模型数学代码等核心指标(...

使用容器服务ACK快速部署QwQ-32B模型并实现推理智能路由
文章 2025-02-27 来自:开发者社区

容器化浪潮下的AI赋能:智能化运维与创新应用

近年来,容器技术以其轻量、高效、可移植的特性席卷IT界,成为云原生时代的基石。从最初的资源隔离到如今的微服务架构,容器技术不断演进,推动着应用开发和部署方式的革新。然而,随着容器化应用的规模日益庞大,复杂度不断提升,传统运维手段逐渐力不从心。此时,人工智能(AIÿ...

阿里云文档 2025-01-14

部署AHPA进行智能预测和资源预热以解决服务弹性滞后问题

阿里云容器计算服务ACS支持AHPA(Advanced Horizontal Pod Autoscaler)弹性能力。AHPA可以根据Prometheus的历史数据进行学习和分析,提前预测未来的资源需求,并据此动态调整Pod副本数量,确保在业务高峰到来之前完成资源的扩容和预热操作,从而提高系统的响应速度和稳定性。同时,当预测到业务低谷时,也会适时缩容以节省资源成本。

文章 2024-12-30 来自:开发者社区

阿里云容器服务AI助手2.0 - 新一代容器智能运维能力

【阅读原文】戳:阿里云容器服务AI助手2.0 - 新一代容器智能运维能力 前言     随着智算时代的到来,人工智能与大模型的发展正引领着一场前所未有的技术变革,AI工具的广泛应用更可谓是推动了各行各业的创新与发展。   智能运维AIOps,是阿里云容器服务团队追求基础能力建设的目标终态。大模型LL...

阿里云容器服务AI助手2.0 - 新一代容器智能运维能力
文章 2024-12-11 来自:开发者社区

拥抱智算时代:阿里云容器服务智能、托管、弹性新体验

本文整理自先河、予栖和路先在2024云栖大会的演讲 很高兴在2024云栖大会容器计算专场,给大家分享容器服务的新产品体验,本次分享,我们聚焦容器服务是如何通过智能、托管、弹性的产品新体验,来助力客户拥抱智算时代的。 ...

拥抱智算时代:阿里云容器服务智能、托管、弹性新体验
文章 2024-09-27 来自:开发者社区

拥抱智算时代:阿里云容器服务智能、托管、弹性新体验

【阅读原文】戳:拥抱智算时代:阿里云容器服务智能、托管、弹性新体验 本文整理自先河、予栖和路先在2024云栖大会的演讲       前言       ...

拥抱智算时代:阿里云容器服务智能、托管、弹性新体验
问答 2024-08-28 来自:开发者社区

阿里云容器服务ACK的智能化升级如何降低容器技术的使用门槛?

阿里云容器服务ACK的智能化升级如何降低容器技术的使用门槛?

问答 2024-08-28 来自:开发者社区

阿里云容器服务ACK的智能化升级中,新一代调度系统Koordinator的主要作用是什么?

阿里云容器服务ACK的智能化升级中,新一代调度系统Koordinator的主要作用是什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注