阿里云文档 2025-03-26

基于ACK多机分布式部署DeepSeek满血版推理部署实战

本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...

阿里云文档 2025-03-19

基于ACK部署DeepSeek蒸馏模型推理服务

本文介绍如何在阿里云容器服务ACK中使用KServe部署生产可用的DeepSeek模型推理服务。

阿里云文档 2025-03-12

Slurm用户及账户配置推荐设置

Slurm提供的账户与用户可被用于管理任务提交以及计费统计。本文主要介绍如何在Slurm集群中正确配置账户和用户,包括创建、修改和删除账户及用户的方法,并深入探讨如何以账户为单位来有效地跟踪和统计任务所消耗的资源量,从而帮助企业或研究机构更好地管理和优化其计算资源的使用效率。

阿里云文档 2025-03-07

通过开发控制台对MLflow仓库模型管理

云原生AI套件支持对MLflow模型仓库中的模型进行管理,本文介绍如何使用云原生AI套件开发控制台进行模型管理。

阿里云文档 2025-03-03

基于ComfyUI编排文生图workflow

ComfyUI是一款开源的图形化AI工作流工具,专注于简化生成式模型(如Stable Diffusion)的开发和部署流程。其基于节点化设计,您可通过拖放模块快速搭建图像生成、文本处理等复杂流程,支持本地与云端部署。本文将介绍如何基于阿里云产品完成ComfyUI的本地安装,包括环境配置、依赖安装及基础使用等步骤。

文章 2023-12-19 来自:开发者社区

云原生|kubernetes|找回丢失的etcd集群节点---etcd节点重新添加,扩容和重新初始化k8s的master节点

前言:VMware安装的四台虚拟机,IP分配为:192.168.217.19/20/21/22 ,采用kubeadm部署的高可用kubernetes集群,该集群使用的是外部扩展etcd集群,etcd集群部署在19 20 21,master也是19 20 21,22为工作节点。具体的配置和安装操作见上一篇文章:云原生|kubernetes|kubeadm部署高可用集群(二)---kube-apis....

文章 2022-11-15 来自:开发者社区

【云原生Kubernetes】二进制搭建Kubernetes集群(下)——部署多master(2)

7.2 所有node节点修改配置文件#修改node节点上的bootstrap.kubeconfig,kubelet.kubeconfig配置文件为VIP cd /opt/kubernetes/cfg/ vim bootstrap.kubeconfig server: https://192.168.41.100:6443 vim kubelet.kubeconfig server: ...

【云原生Kubernetes】二进制搭建Kubernetes集群(下)——部署多master(2)
文章 2022-11-15 来自:开发者社区

【云原生Kubernetes】二进制搭建Kubernetes集群(下)——部署多master(1)

前言多master集群架构图:网络异常,图片无法展示|架构说明:node节点的kubelet只能对接一个master节点的apiserver,不可能同时对接多个master节点的apiserver。简而言之,node节只能有一个master来领导。kubelet和kube-proxy是通过kubelet.kubeconfig和kube-proxy.kubeconfig文件中的server参数进行....

【云原生Kubernetes】二进制搭建Kubernetes集群(下)——部署多master(1)
文章 2022-11-15 来自:开发者社区

【云原生Kubernetes】二进制搭建Kubernetes集群(上)——部署etcd集群和单master(2)

三、部署 Master 组件master01:192.168.41.10#在 master01 节点上操作,因为master01和etcd01部署在同一台机器上,所以/opt/k8s/目录已存在。 #上传 master.zip 和 k8s-cert.sh 到 /opt/k8s 目录中,解压 master.zip 压缩包 cd /opt/k8s/ unzip master.zip chmo...

【云原生Kubernetes】二进制搭建Kubernetes集群(上)——部署etcd集群和单master(2)
文章 2022-11-15 来自:开发者社区

【云原生Kubernetes】二进制搭建Kubernetes集群(上)——部署etcd集群和单master(1)

单master集群架构图:网络异常,图片无法展示|目前Kubernetes最新版本是v1.24,但大部分公司一般不会使用最新版本。目前公司使用比较多的:老版本是v1.15,因为v1.16改变了很多API接口版本,新版本使用比较多的是v1.18、v1.20。一、实验环境注意:生产环境中,etcd集群和master、node节点都应该部署在不同的机器上,此处为了实验方便,将三台etcd节点分别部署在....

【云原生Kubernetes】二进制搭建Kubernetes集群(上)——部署etcd集群和单master(1)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云云原生

关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践

+关注