阿里云文档 2025-04-24

部署DeepSeek-V3、DeepSeek-R1模型

DeepSeek-V3是由深度求索公司推出的一款拥有6710亿参数的专家混合(MoE)大语言模型,DeepSeek-R1是基于DeepSeek-V3-Base训练的高性能推理模型。Model Gallery提供了标准部署和多种加速部署方式,帮助您一键部署DeepSeek-V3和DeepSeek-R1...

阿里云文档 2025-03-21

微调DeepSeek-R1

DeepSeek-R1是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异。深度求索不仅开源了DeepSeek-R1模型,还发布了从DeepSeek-R1基于Llama和Qwen蒸馏而来的六个密集模型,在各项基准测试中均表现出色。本文以蒸馏模型DeepSeek-R1-Distill-Qwen-7B为例,为您介绍如何微调该系列模型。

阿里云文档 2025-03-19

DSW跨域拉取海外模型或容器镜像

当您使用海外容器镜像(如:docker.io镜像)创建DSW实例,或者在DSW实例中拉取海外模型时(如:huggingface.co模型),可能由于网络跨域的原因无法正常访问,为解决此问题,您可以创建全球加速GA(Global Accelerator)实例,使用其提供的覆盖全球的网络加速服务,使DSW具备跨域获取模型和镜像的网络访问能力。

阿里云文档 2025-01-15

微调、部署并实现Llama-3.1模型的高效推理

阿里云PAI灵骏智算服务是面向大规模深度学习场景的智算产品,提供一站式的异构计算资源和AI工程化平台。本方案将为您介绍如何使用阿里云PAI灵骏智算服务,以及基于Meta-Llama-3.1-8B的开源模型和Megatron的训练流程,进行模型微调、离线推理验证,并实现在线服务部署。

阿里云文档 2024-10-18

EAS模型在线服务预标注

iTAG支持在线模型服务预标注,创建EAS模型在线服务后,您可以在模型服务中完成注册,然后在创建任务的时候利用模型服务进行预标注。

文章 2024-06-11 来自:开发者社区

人工智能平台PAI产品使用合集之多目标模型eval比较耗时间,该如何优化

问题一:机器学习PAI还是会在batch内根据batch中最长序列做mask? 机器学习PAI如果不设置是有一个默认mask长度,还是会在batch内根据batch中最长序列做mask? 参考回答: 如果不输入是好像最大长度 如果设置会有截断,不设置就是最大的长度了 关于本问题的更多回答可点击原文查看: https://dev...

人工智能平台PAI产品使用合集之多目标模型eval比较耗时间,该如何优化
文章 2024-06-11 来自:开发者社区

人工智能平台PAI产品使用合集之如何删除oss路径上特定的模型

问题一:机器学习PAI是不是就是label_fields里设置个treat? 机器学习PAI是不是就是label_fields里设置个treat,然后在tower里就能直接读这个字段,设置task_space_indicator_label='treat'就行? ...

人工智能平台PAI产品使用合集之如何删除oss路径上特定的模型
文章 2024-06-11 来自:开发者社区

人工智能平台PAI产品使用合集之Alink是否加载预训练好的pytorch模型

问题一:请问机器学习PAI在dsw中如何将文件存储到nas? 请问机器学习PAI在dsw中如何将文件存储到nas? 参考回答: 在机器学习PAI的DSW中,如果您需要将文件存储到NAS,首先需要创建NAS类型的数据集。随后,将这个数据集挂载到DSW指定的路径下,就可以在DSW中读写NAS中的数据集数据。此外,DSW实例默认提供的系统盘为临时存储,如果需...

人工智能平台PAI产品使用合集之Alink是否加载预训练好的pytorch模型
文章 2024-04-28 来自:开发者社区

人工智能平台PAI产品使用合集之是否可以在模型部署发布后以http接口形式提供给业务开发人员使用

问题一:机器学习PAI阿里云智能推荐产品,与PAI有什么区别? 机器学习PAI阿里云智能推荐产品,与PAI有什么区别? 参考答案: 机器学习PAI(Machine Learning Platform as a Service)和阿里云智能推荐产品都是基于阿里云的产品,但它们之间有所不同。 机器学习PAI是一个端到端的机器学习平台,可以用于大规模...

文章 2024-04-28 来自:开发者社区

人工智能平台PAI产品使用合集之机器学习PAI EasyRec训练时,怎么去除没有意义的辅助任务的模型,用于部署

问题一:机器学习PAI EasyRec训练时,如何导出直接去除这些没有意义的辅助任务的模型,用于部署? 机器学习PAI EasyRec训练时,多个辅助任务提高训练效果。如何导出直接去除这些没有意义的辅助任务的模型,用于部署?有简便方式吗? 参考答案: 可以使用PLE(Progressive Layered Extraction)来导出直接去除没有意义的...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐