阿里云文档 2025-04-02

基于ACK集群的Dify组件升级指南

本文主要指导用户将ack-dify从旧版本升级至v1.0.0及以上,首先备份数据,然后通过命令提取并安装插件迁移工具至插件系统,最后验证插件功能是否正常运行,以启用新的插件生态系统。

阿里云文档 2025-04-01

在ACK中使用KTransformers部署DeepSeek-R1模型

KTransformers框架实现了多种LLM推理优化,进一步减少了推理阶段的显存占用,从而提高推理性能和降低GPU资源成本。本文介绍如何在阿里云容器服务 Kubernetes 版中通过KTransformers实现高效部署671B参数的DeepSeek-R1-Q4_K_M量化模型推理服务。

阿里云文档 2025-03-25

设置Slurm队列优先级

为了更有效地管理和分配资源,优化作业调度,提升系统利用率,并满足多样化的作业需求,队列成为任务调度中不可或缺的配置项。合理的队列设置能够确保高优先级的任务优先获得所需资源,从而最大化资源利用效率。本文介绍在Slurm系统环境下,当出现作业提交或作业状态变化时,如何通过恰当的队列配置策略来实现尽可能多的任务调度处理,以达到最佳性能。

阿里云文档 2025-03-12

Slurm用户及账户配置推荐设置

Slurm提供的账户与用户可被用于管理任务提交以及计费统计。本文主要介绍如何在Slurm集群中正确配置账户和用户,包括创建、修改和删除账户及用户的方法,并深入探讨如何以账户为单位来有效地跟踪和统计任务所消耗的资源量,从而帮助企业或研究机构更好地管理和优化其计算资源的使用效率。

阿里云文档 2025-03-07

通过开发控制台对MLflow仓库模型管理

云原生AI套件支持对MLflow模型仓库中的模型进行管理,本文介绍如何使用云原生AI套件开发控制台进行模型管理。

文章 2023-05-22 来自:开发者社区

SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇(上)

作者:凌可(彭兰舒)、雪尧(郭耀星) 这是我们的《Kubernetes资源编排系列》的第二篇——Helm篇,在上篇《Kubernetes资源编排系列之一:Pod YAML篇》中,我们见识到了Pod YAML的强大能力,在k8s的集群中,所见之处皆是YAML。YAML多了之后,大家就希望有一种方案能将海量的YAML管理起来。于是本篇我们来介绍一下Helm。 一、 Helm是什么....

SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇(上)
文章 2023-05-22 来自:开发者社区

SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇(中)

三、 Helm的优点 • 生命周期管理:可以实现对组件实例的查询、安装、卸载、升级、回滚。• 方便的命令行:对于简单变量,可以在部署的同时指定对应的参数,方便部署。• 插件和工具生态:作为CNCF项目,Helm已经变成了K8S基础生态的一部分,各种各样的外部系统都会对它进行默认支持,CICD工具集成方面有得天独厚的优势;同时用户能够从社区中获取丰富的专业知识和共享的Chart包。• 确....

SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇(中)
文章 2023-05-22 来自:开发者社区

SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇(下)

六、 SREWorks应用Helm组件实践 Tips虽然Helm官方将自身托管的Chart对应的包称为应用(Application),但在一个真实的复杂应用(Application)下,Helm Chart更像是应用(Application)中的组件(Component)。故在SREWorks中将Helm托管的Chart 归为组件(Component)。 点击进入SREWor....

SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇(下)
文章 2023-05-17 来自:开发者社区

【云原生】我将ChatGPT变成Kubernetes 和Helm 终端

作为一种高度先进的语言模型,ChatGPT 可以根据特定任务或特定数据进行处理,以进一步提高其准确性和性能。它可以在 Linux 命令和相应输出的数据集上微调,也可以在 Helm 命令和相应输出的数据集上进行微调,以分别模拟 Linux 终端或 Helm 。以下是我如何将 ChatGPT 变成 Kubernetes 和 Helm 的过程。你好GPT。我希望你充当Mac终端,已经安装了Kubern....

【云原生】我将ChatGPT变成Kubernetes 和Helm 终端
文章 2022-06-10 来自:开发者社区

EggJS 云原生应用硬核实战(Kubernetes+Traefik+Helm+Prometheus+Grafana)

介绍这是一个关于 Egg.js 应用上云☁️的示例,笔者所在的大前端团队的已应用于生产。CI/CD & DevOps & GitOps & HPA 等这里暂不做讨论,因为每一个点篇幅都很长。我这里的实验条件一个可用的 Kubernetes 集群已在集群中部署 Kube-Prometheus-Stack已在集群中部署 Traefik v2.2 作为 Ingress Cont....

EggJS 云原生应用硬核实战(Kubernetes+Traefik+Helm+Prometheus+Grafana)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云云原生

关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践

+关注