阿里云文档 2025-04-30

使用云原生AI套件分析优化机器学习模型

为了确保模型在正式部署前达到上线标准,您可以使用模型分析优化工具对模型进行性能压测、模型分析、模型优化等操作,对模型的性能进行分析优化。本文以PyTorch官方提供的Resnet18模型、GPU类型为V100卡为例,介绍如何使用模型分析优化工具。

文章 2025-02-27 来自:开发者社区

容器化机器学习流水线:构建可复用的AI工作流

在前两篇文章中,我们探讨了AI模型的容器化部署,并展示了如何将训练好的模型打包成容器镜像,部署到Kubernetes集群中提供推理服务。然而,AI模型的开发和部署并非一蹴而就,而是一个包含数据预处理、模型训练、评估、部署等多个步骤的复杂流程。为了提高效率并确保可重复性,我们需要将整个流程自动化,构建...

阿里云文档 2025-01-14

部署机器学习模型服务框架KServe组件

KServe是一个基于Kubernetes的机器学习模型服务框架,支持以Kubernetes CRD的形式将单个或多个经过训练的模型(例如TFServing、TorchServe、Triton等推理服务器)部署到模型服务运行时,使得模型的部署、更新和扩展变得更加简单快捷。您可以在控制台安装KServe的核心组件,KServe Controller,以获得基于请求流量自动扩容等能力。

问答 2023-09-25 来自:开发者社区

有人知道机器学习PAI的容器话后的flink集群为什么就获取不到lazy的数据了吗?

有人知道机器学习PAI的容器话后的flink集群为什么就获取不到lazy的数据了吗?本地单节点的就正常

问答 2023-07-11 来自:开发者社区

机器学习PAI的inference为什么不考虑容器部署,流量变更,进程怎么上下线?

机器学习PAI的inference为什么不考虑容器部署,流量变更,进程怎么上下线?

问答 2023-06-05 来自:开发者社区

机器学习PAI并行度设置为1,容器运行java进程因为OOM被自动杀掉,除了增大内存还有别的办法吗?

在机器学习PAI并行度设置为1,容器运行java进程因为OOM被自动杀掉,这个除了增大内存,还有别的办法吗?因为搞机器配额比较麻烦。

问答 2023-04-25 来自:开发者社区

机器学习PAIdeeprec 可以读hdfs上的数据吗? 还是需要在容器中再加上hdfs的相关jar

机器学习PAIdeeprec 可以读hdfs上的数据吗? 还是需要在容器中再加上hdfs的相关jar包

问答 2023-04-15 来自:开发者社区

问一下关于机器学习PAI的问题,容器中没有sok, 请问这个应怎样install呢?

容器中没有sok, 请问这个应怎样install呢?

问答 2023-01-16 来自:开发者社区

机器学习pai部署模型在线服务时,容器内部是不是不能调用外网服务?

机器学习pai部署模型在线服务时,容器内部是不是不能调用外网服务?

问答 2022-04-06 来自:开发者社区

如何理解容器在基于高性能计算的机器学习场景的应用?

如何理解容器在基于高性能计算的机器学习场景的应用?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注