阿里云文档 2025-03-17

基于ACK多机分布式部署DeepSeek满血版推理部署实战

本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...

阿里云文档 2025-03-12

Slurm用户及账户配置推荐设置

Slurm提供的账户与用户可被用于管理任务提交以及计费统计。本文主要介绍如何在Slurm集群中正确配置账户和用户,包括创建、修改和删除账户及用户的方法,并深入探讨如何以账户为单位来有效地跟踪和统计任务所消耗的资源量,从而帮助企业或研究机构更好地管理和优化其计算资源的使用效率。

阿里云文档 2025-03-07

基于ACK部署DeepSeek蒸馏模型推理服务

本文介绍如何在阿里云容器服务ACK中使用KServe部署生产可用的DeepSeek模型推理服务。

阿里云文档 2025-03-07

通过开发控制台对MLflow仓库模型管理

云原生AI套件支持对MLflow模型仓库中的模型进行管理,本文介绍如何使用云原生AI套件开发控制台进行模型管理。

阿里云文档 2025-03-03

基于ComfyUI编排文生图workflow

ComfyUI是一款开源的图形化AI工作流工具,专注于简化生成式模型(如Stable Diffusion)的开发和部署流程。其基于节点化设计,您可通过拖放模块快速搭建图像生成、文本处理等复杂流程,支持本地与云端部署。本文将介绍如何基于阿里云产品完成ComfyUI的本地安装,包括环境配置、依赖安装及基础使用等步骤。

文章 2024-08-01 来自:开发者社区

探索云原生技术:Kubernetes在现代应用部署中的角色打造个性化移动体验:从开发到操作系统定制

随着企业数字化转型步伐的加快,云计算已成为支撑现代应用发展的关键技术基础。在这一背景下,云原生(Cloud Native)技术应运而生,它强调构建可弹性扩展、松散耦合的服务,以适应快速变化的业务需求。作为云原生生态中的重要一员,Kubernetes已经成为事实上的容器编排标准,助力开发...

文章 2022-08-12 来自:开发者社区

企业级运维之云原生与Kubernetes实战课程 - 第二章第7讲 实验二:应用部署进阶

企业级运维之云原生与Kubernetes实战课程第二章第7讲 实验二:应用部署进阶  视频地址:https://developer.aliyun.com/learning/course/913/detail/14611 一、实验简介 该实验是“云原生与Kubernetes基础课程”的配套实验。 涉及ACK集群上ingress、pod,以及日志服务、hpa的....

企业级运维之云原生与Kubernetes实战课程 - 第二章第7讲 实验二:应用部署进阶

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云云原生

关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践

+关注