阿里云文档 2024-09-13

ACK集群上实现Slurm HPC & Kubernetes负载混合调度

本文介绍了Slurm HPC与Kubernetes融合的负载调度策略,旨在通过优化资源配置与作业调度机制,不仅能提升计算资源的利用率,还增强了系统整体的稳定性和运行效能。此方案确保在满足多种计算场景需求的同时,为您构建一个更为高效且灵活的计算平台。

阿里云文档 2024-09-12

使用成本洞察识别集群工作负载的风险

为快速识别ACK集群工作负载的稳定性、性能或成本风险,您可以通过为集群开启成本洞察功能来实现。成本洞察不仅提供集群所有资源的使用率,而且还专门为QoS类别为Burstable和BestEffort的Pod提供详细的数据视图以监控资源配置。本文介绍如何使用成本洞察功能分析集群资源的风险性。

阿里云文档 2024-09-09

启用Knative服务成本洞察实现集群成本管理

成本洞察功能可以协助企业IT成本管理人员从多维度了解集群资源使用量及成本分布,提供成本节约建议。本文介绍如何在Knative中启用成本洞察功能。

阿里云文档 2024-09-02

如何创建多集群应用

多集群应用控制台可以简化多集群应用编排(ArgoCD ApplicationSet),它可以基于单一应用编排并根据您的编排内容自动生成一个或多个应用。本文介绍如何使用ACK One控制台创建多集群应用。

阿里云文档 2024-08-30

使用配置巡检检查集群Workload的安全配置

ACK提供巡检功能,帮助您扫描集群中工作负载配置的安全隐患。执行巡检任务后,系统会生成巡检报告,您可以根据报告结果查看并处理风险项,实时了解集群中工作负载的健康状态。

文章 2022-03-07 来自:开发者社区

在阿里巴巴,我们如何先于用户发现和定位 Kubernetes 集群问题?

作者:彭南光(光南)本文整理自阿里云高级研发工程师彭南光(光南) 在 KubeCon China 2021 大会的演讲实录,分享了阿里巴巴是如何通过自研通用链路探测+定向巡检工具 KubeProbe 应对大规模集群的稳定性挑战的。关于阿里云云原生团队在本次 KubeCon 上分享的全部内容沉淀于电子书《云原生与云未来的新可能》当中,可点击文末“阅...

在阿里巴巴,我们如何先于用户发现和定位 Kubernetes 集群问题?
问答 2022-01-20 来自:开发者社区

有没有可参考的关于如何在用户面前发现和定位Kubernetes集群问题的Demo?

有没有可参考的关于如何在用户面前发现和定位Kubernetes集群问题的Demo?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注
相关镜像