阿里云文档 2024-11-29

微调、部署并实现Llama-3.1模型的高效推理

阿里云PAI灵骏智算服务是面向大规模深度学习场景的智算产品,提供一站式的异构计算资源和AI工程化平台。本方案将为您介绍如何使用阿里云PAI灵骏智算服务,以及基于Meta-Llama-3.1-8B的开源模型和Megatron的训练流程,进行模型微调、离线推理验证,并实现在线服务部署。

阿里云文档 2024-11-15

大语言模型数据增强与模型蒸馏解决方案

大语言模型的训练和推理过程存在高能耗及长响应时间等问题,这些问题限制了其在资源有限场景中使用。为了解决这些问题,PAI提出了模型蒸馏功能。该功能支持将大模型知识迁移到较小模型,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求,为更多的实际应用场景提供支持。本文将以通义千问2(Qwen2)大语言模型为基础,为您介绍大语言模型数据增强和蒸馏解决方案的完整开发流程。

阿里云文档 2024-11-15

大语言模型数据增强与模型蒸馏解决方案

大语言模型的训练和推理过程存在高能耗及长响应时间等问题,这些问题限制了其在资源有限场景中使用。为了解决这些问题,PAI提出了模型蒸馏功能。该功能支持将大模型知识迁移到较小模型,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求,为更多的实际应用场景提供支持。本文将以通义千问2(Qwen2)大语言模型为基础,为您介绍大语言模型数据增强和蒸馏解决方案的完整开发流程。

阿里云文档 2024-10-22

大模型评测

大模型评测

阿里云文档 2024-10-18

EAS模型在线服务预标注

iTAG支持在线模型服务预标注,创建EAS模型在线服务后,您可以在模型服务中完成注册,然后在创建任务的时候利用模型服务进行预标注。

问答 2024-08-16 来自:开发者社区

在机器学习PAI中,训练了一个 dssm 模型,感觉负采样没有生效,这是为什么?

在机器学习PAI中,训练了一个 dssm 模型,但是 predict 概率全是 1,感觉负采样没有生效,这是为什么?

问答 2024-08-14 来自:开发者社区

机器学习PAI有两个关于 DSSM 模型负采样的问题想要请教一下?

机器学习PAI有两个关于 DSSM 模型负采样的问题想要请教一下1)这里的负采样数量是指:针对每个正样本随机负采样 n 个负样本吗2)这里的 Hard Negative 负采样具体是怎么采样的,是基于规则吗,比如随机抽取与正样本同类目的 item 作为负样本之类的?

问答 2024-07-31 来自:开发者社区

机器学习PAI给的dssm 负采样的demo中 模型结构是双塔,输出N个候选item的概率吗?

机器学习PAI给的dssm 负采样的demo中 模型结构是双塔,loss 是softmax_Cross_entropy, 是双塔算内积,输出N个候选item的概率吗?然后为啥建议使用inner product呢,常见的是cosine sim? 这块有什么考虑吗?

问答 2024-07-30 来自:开发者社区

机器学习PAI在dsw上进行单机训练dssm模型,报这个错误这是什么原因呢?

机器学习PAI在dsw上进行单机训练dssm模型,报这个错误呢,这个表的schema明明就是expect:int,float,string,在datworks 的pai命令运行就正常,这是什么原因呢?

问答 2024-07-30 来自:开发者社区

我使用机器学习PAI easyRec中的dssm模型做召回,要使用其中的负采样版本怎么办?

我使用机器学习PAI easyRec中的dssm模型做召回,要使用其中的负采样版本,negative_sampler_v2加权随机负采样。 按照文档和github上的配置文件。结果跑不通,一直报错?部分的配置文件如下 data_config如下negative_sampler_v2 配置feature_config数据如下:

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注