阿里云文档 2025-11-28

使用Gateway with Inference Extension实现推理请求排队与优先级调度

Gateway with Inference Extension支持基于推理服务负载感知的推理请求排队与优先级调度。当生成式AI推理服务后端模型服务器满载时,可以根据模型优先级对队列中的推理请求进行优先级调度,即优先响应高优先级模型的请求。本文主要介绍Gateway with Inference Extension的推理请求排队与优先级调度能力。

阿里云文档 2025-11-21

基于库存感知的跨地域多集群弹性调度

ACK One多集群舰队在多地域应用服务部署场景下,针对多地域资源调配的难题设计并实现了基于库存感知的智能调度器。本文介绍库存感知的工作原理以及如何开启和使用库存感知调度能力。

阿里云文档 2025-10-17

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

阿里云文档 2025-09-04

【组件升级】共享GPU调度组件升级公告

共享GPU调度组件的隔离模块cGPU版本小于1.5.13时,残留进程可能导致小概率的内核崩溃。

阿里云文档 2025-07-18

通过XXL-JOB调度Dify工作流

Dify工作流在许多场景中需要依赖调度来实现自动化任务,如风险监控、数据分析、内容生成、数据同步等典型应用场景。然而,Dify原生并不支持调度功能。为解决这一问题,本文介绍如何集成XXL-JOB分布式任务调度,用于实现工作流应用的调度和状态监控,并确保工作流的稳定运行。

文章 2024-10-11 来自:开发者社区

Kubernetes的Pod调度:让你的应用像乘坐头等舱!

一、Kubernetes 中 Pod 调度的重要性在 Kubernetes 的世界里,Pod 调度就像是一个繁忙的交通指挥官,负责把小车(也就是我们的 Pod)送到最合适的停车位(节点)。调度不仅关乎资源的合理利用,还关乎应用的“生死存亡”,下面让我们来看看为什么调度这么重要。 资源优...

文章 2024-10-10 来自:开发者社区

k8s的Pod常见的几种调度形式

1 常见的Pod调度方式: 1 自由调度: 默认的kube-scheduler调度 2 定向调度:nodeName, nodeSelector实现 3 亲和性调度:nodeAffinity, PodAffinity, PodAntiAffinity实现 4 污点和容忍调度:taint,tolerations实现 2 实践 2.1 定向调度 ...

文章 2024-10-07 来自:开发者社区

k8s学习--如何控制pod调度的位置

@[TOC] ···· 在 Kubernetes (K8s)中,Pod 是应用运行的最小单位,而控制 Pod 的调度位置对于应用的性能、可用性和资源利用率有着重要影响。在这篇博客中,将展示通过多种策略和机制来控制 Pod 在集群中的调度位置,以满足特定的业务需求。 一、Pod 调度基础 Kubernetes 集群由多个节点组成&#x...

文章 2024-08-24 来自:开发者社区

在K8S中,Pod多副本配置了硬亲和性,会调度到同⼀个节点上吗?

在K8S(Kubernetes)中,Pod多副本配置硬亲和性(podAffinity的requiredDuringSchedulingIgnoredDuringExecution)时,并不意味着这些Pod一定会被调度到同一个节点上。硬亲和性的配置实际上是指定了Pod调度时必须满足的严格条件,但这些条件通常与Pod之间的相对位置(如是否在同一个节点、区域或拓扑域内)有关,而不是直接指定它们必须位于....

文章 2024-08-24 来自:开发者社区

在K8S中,影响Pod调度策略的有哪些?

在Kubernetes(K8S)中,影响Pod调度策略的因素众多,这些因素共同决定了Pod最终将被调度到哪个节点上运行。以下是影响Pod调度策略的主要因素: 1. 资源请求与限额 资源请求(Requests):Pod在创建时会声明需要的最小资源量,如CPU和内存。调度器会寻找至少能满足这些资源请求的Node进行调度。 资源限额(Limits):Pod可使用的...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。