阿里云文档 2024-09-05

使用LLM智能路由提升推理效率

在大语言模型(LLM)应用场景中,存在资源需求不确定性、后端推理实例负载不均衡等问题。为了优化这类问题,EAS引入了LLM智能路由基础组件,在请求调度层,基于LLM场景所特有的Metrics(指标),来动态进行请求分发,保证后端推理实例处理的算力和显存尽可能均匀,提升集群资源使用水位。

阿里云文档 2024-08-23

微调、部署并实现Llama-3.1模型的高效推理

阿里云PAI灵骏智算服务是面向大规模深度学习场景的智算产品,提供一站式的异构计算资源和AI工程化平台。本方案将为您介绍如何使用阿里云PAI灵骏智算服务,以及基于Meta-Llama-3.1-8B的开源模型和Megatron的训练流程,进行模型微调、离线推理验证,并实现在线服务部署。

阿里云文档 2024-08-23

微调、部署并实现Llama-3模型的高效推理

Meta已开源Llama-3,推出了8B和70B两种参数量的大语言模型。阿里云PAI灵骏智算服务是面向大规模深度学习场景的智算产品,提供一站式的异构计算资源和AI工程化平台。本方案将为您介绍如何使用阿里云PAI灵骏智算服务,以及基于Meta-Llama-3-8B的开源模型和Megatron的训练流程,进行模型微调、离线推理验证,并实现在线服务部署。

问答 2024-08-07 来自:开发者社区

如果有的特征变换在线上推理时也要做,机器学习PAI怎么保证线上线下用的特征变换算子是一致的?

如果有的特征变换在线上推理时也要做,机器学习PAI怎么保证线上线下用的特征变换算子是一致的?

问答 2024-07-23 来自:开发者社区

大模型推理和大模型训练有啥区别?

大模型推理和大模型训练有啥区别?

阿里云文档 2024-07-11

图像生成推理

图像生成推理算法主要利用训练好的模型来生成符合特定特征或条件的高质量图像。它支持加载各种经过训练的GAN模型(如DCGAN、WGAN-GP、LSGAN、GGAN、PGGAN和StyleGAN),并基于随机噪声生成新图像。该算法广泛应用于图像生成、图像增强和数据增强等多个领域。

阿里云文档 2024-07-08

MLP回归的推理过程

MLP(Multilayer Perceptron,多层感知器)回归是一种基于神经网络的回归算法,主要用于解决非线性回归问题。它通过多个隐藏层将输入特征映射到输出,能够捕捉复杂的模式和关系。MLP回归算法在推理阶段的主要任务是使用训练好的模型对新数据进行预测。这一过程包括加载模型、预处理新数据、通过前向传播计算、获取最终预测结果。

问答 2024-05-01 来自:开发者社区

ModelScope推理模型训练脚本貌似有问题,怎么解决?

ModelScope推理模型训练脚本貌似有问题,根据报错 map_dict = {0: "矛盾", 1: "蕴涵", 2: "中立"} 这里不应该是中文,怎么解决? https://www.modelscope.cn/models/damo/nlp_structbert_nli_chinese-base/summary

问答 2023-05-03 来自:开发者社区

请问下,如果我只需要一个文本分类任务的标注、训练、推理、部署,是否就不需要采购pai服务了?只用采购

请问下,如果我只需要一个文本分类任务的标注、训练、推理、部署,是否就不需要采购pai服务了?只用采购咱们nlp就行了?

文章 2023-04-12 来自:开发者社区

AI推理服务平台升级,阿里云机器学习PAI推出新规格

导语:随着生成式AI模型不断拓宽AI应用的场景边界,模型在线服务的数量级快速增长,AI推理环节亟需精细化的资源管理。近日,阿里云机器学习平台PAI宣布全面升级模型服务平台PAI-EAS,面向文图生成、大语言模型等各类模型提供弹性稳定的推理服务,并推出全新规格GU30,与传统规格相比价格平均优惠45%...

AI推理服务平台升级,阿里云机器学习PAI推出新规格

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注