阿里云文档 2025-04-27

在ACK中使用KTransformers部署DeepSeek-R1模型

KTransformers框架实现了多种LLM推理优化,进一步减少了推理阶段的显存占用,从而提高推理性能和降低GPU资源成本。本文介绍如何在阿里云容器服务 Kubernetes 版中通过KTransformers实现高效部署671B参数的DeepSeek-R1-Q4_K_M量化模型推理服务。

阿里云文档 2025-04-02

基于ACK集群的Dify组件升级指南

本文主要指导用户将ack-dify从旧版本升级至v1.0.0及以上,首先备份数据,然后通过命令提取并安装插件迁移工具至插件系统,最后验证插件功能是否正常运行,以启用新的插件生态系统。

阿里云文档 2025-03-25

设置Slurm队列优先级

为了更有效地管理和分配资源,优化作业调度,提升系统利用率,并满足多样化的作业需求,队列成为任务调度中不可或缺的配置项。合理的队列设置能够确保高优先级的任务优先获得所需资源,从而最大化资源利用效率。本文介绍在Slurm系统环境下,当出现作业提交或作业状态变化时,如何通过恰当的队列配置策略来实现尽可能多的任务调度处理,以达到最佳性能。

阿里云文档 2025-03-12

Slurm用户及账户配置推荐设置

Slurm提供的账户与用户可被用于管理任务提交以及计费统计。本文主要介绍如何在Slurm集群中正确配置账户和用户,包括创建、修改和删除账户及用户的方法,并深入探讨如何以账户为单位来有效地跟踪和统计任务所消耗的资源量,从而帮助企业或研究机构更好地管理和优化其计算资源的使用效率。

阿里云文档 2025-03-07

通过开发控制台对MLflow仓库模型管理

云原生AI套件支持对MLflow模型仓库中的模型进行管理,本文介绍如何使用云原生AI套件开发控制台进行模型管理。

文章 2024-11-27 来自:开发者社区

云原生入门与实践:Kubernetes的简易部署

云原生是一种构建和运行应用程序的方法,充分利用了云计算的优势。它强调在容器、服务网格、微服务和声明式API的基础上构建和部署软件。而Kubernetes作为容器编排的事实标准,在云原生生态中占据核心地位。 什么是云原生? 云原生不仅仅是关于在云上运行应用,更关乎如何构建和部署这些应用。它倡导使用容器、服务、自动化管理和微服务架构来提高应用的...

文章 2024-11-25 来自:开发者社区

云原生入门:Kubernetes 和容器化基础

在当今快速发展的技术世界中,云计算已成为企业和个人不可或缺的一部分。随着技术的发展,我们见证了从传统的服务器托管到虚拟化技术,再到现在的云原生应用的巨大转变。云原生是一种构建和运行应用程序的方法,它充分利用了云计算的灵活性、可扩展性和冗余性。在这篇文章中,我们将重点介绍两个核心概念:Kubernetes和容器化。...

文章 2024-11-22 来自:开发者社区

云原生技术入门:Kubernetes和Docker的协同工作

随着云计算技术的不断进步,云原生(Cloud Native)已经成为软件开发、部署及运维的一种重要模式。云原生技术使得应用程序能够在云端更加灵活、自动化地运行,而容器技术则是实现这一目标的基石。在众多容器技术中,Docker和Kubernetes无疑是最闪耀的两颗星。今天,我们就来深入了解它们是如何协同工作的。 ...

文章 2024-11-20 来自:开发者社区

云原生入门:Kubernetes的简易指南

云原生技术正在改变我们构建、部署和管理应用的方式。在这个领域,Kubernetes无疑是最耀眼的明星之一。它是一个开源的容器编排系统,可以帮助你自动化地部署、扩展和管理容器化应用。 那么,什么是Kubernetes呢?简单来说,它是一个平台,可以让你的应用在多个服务器上运行,而不需要你手动管理这些服...

文章 2024-11-16 来自:开发者社区

深入云原生:Kubernetes 集群部署与管理实践

在当今这个信息爆炸的时代,企业对于IT系统的要求越来越高,他们需要的是能够快速响应市场变化、易于扩展和维护的系统。云原生技术,特别是基于容器的解决方案如Kubernetes,提供了这样的能力。Kubernetes不仅能够自动化应用程序的部署、扩展和管理,还能保证应用的高可用性和负载均衡。 首先,我们需要准备适合K...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云云原生

关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践

+关注