阿里云文档 2025-02-14

部署DeepSeek-V3、DeepSeek-R1模型

DeepSeek-V3是由深度求索公司推出的一款拥有6710亿参数的专家混合(MoE)大语言模型,DeepSeek-R1是基于DeepSeek-V3-Base训练的高性能推理模型。Model Gallery提供了BladeLLM、SGLang和vLLM加速部署功能,帮助您一键部署DeepSeek-V3和DeepSeek-R1系列模型。

阿里云文档 2025-02-10

微调DeepSeek-R1

DeepSeek-R1是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异。深度求索不仅开源了DeepSeek-R1模型,还发布了从DeepSeek-R1基于Llama和Qwen蒸馏而来的六个密集模型,在各项基准测试中均表现出色。本文以蒸馏模型DeepSeek-R1-Distill-Qwen-7B为例,为您介绍如何微调该系列模型。

阿里云文档 2025-01-08

PAI-Rec 模型部署到PAI-EAS

模型部署到PAI-EAS介绍完成补数据和模型训练以后,下一步是将模型部署到PAI-EAS,进行线上打分。操作指南在DataWorks中找到部署脚本点击解锁,进行修改脚本将最后一行代码注释,倒数第二行代码取消注释。倒数第二行是创建PAI-EAS服务的命令,最后一行是更新模型的命令。第一次执行需要执行创...

阿里云文档 2024-12-03

Llama-3模型部署与微调

Llama-3是Meta AI推出的开源大语言模型系列(接近GPT-4级别)。该系列模型利用超过15万亿Token的公开数据进行预训练,提供Base和Instruct等多版本、多规模的开源模型,从而满足不同的计算需求。PAI已对该系列模型进行全面支持,本文以Meta-Llama-3-8B-Instruct模型为例为您介绍如何在Model Gallery中部署和微调该系列模型。

阿里云文档 2024-11-20

通义千问1.5模型部署与微调

通义千问1.5(qwen1.5)是阿里云研发的通义千问系列开源大模型。该系列包括Base和Chat等多版本、多规模的开源模型,从而满足不同的计算需求。PAI已对该系列模型进行全面支持,本文以通义千问1.5-7B-Chat模型为例为您介绍如何在Model Gallery中部署和微调该系列模型。

文章 2024-11-19 来自:开发者社区

探索机器学习中的深度学习模型:原理与应用

本文旨在介绍深度学习作为机器学习的一个重要分支,其基本原理、常见模型(如CNN、RNN、LSTM、Transformer等)以及在实际应用中的案例,如图像识别、自然语言处理等。 内容片段: 深度学习基础:简述机器学习与深度学习的关系,介绍神经网络的基本结构和训练过程。常见深度学习模型:...

文章 2022-12-08 来自:开发者社区

【阿旭机器学习实战】【10】朴素贝叶斯模型原理及3种贝叶斯模型对比:高斯分布朴素贝叶斯、多项式分布朴素贝叶斯、伯努利分布朴素贝叶斯

朴素贝叶斯【关键词】 概率,贝叶斯公式,古典数学朴素:独立性假设贝叶斯公式优点:朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率;对小规模的数据表现很好;能处理多分类任务,适合增量式训练;对缺失数据不太敏感,算法也比较简单,常用于文本分类缺点:只能用于分类问题需要计算先验概率;分类决策存在错误率;对输入数据的表达形式很敏感1. 朴素贝叶斯原理朴素贝叶斯算法是一个典型的统计....

【阿旭机器学习实战】【10】朴素贝叶斯模型原理及3种贝叶斯模型对比:高斯分布朴素贝叶斯、多项式分布朴素贝叶斯、伯努利分布朴素贝叶斯
文章 2022-02-17 来自:开发者社区

深入讨论机器学习 8 大回归模型的基本原理以及差异!

几乎每个机器学习从业者都知道回归,其中一些人可能认为这没什么大不了的,只是从参数之间的切 换罢了。本文将阐明每种回归算法的细节,以及确切的区别。包括 :OLSWeighted Least SquaresLassoRidgePolynomial RegressionLogistic regressionSupport Vector RegressionElastic NetBayesian Reg....

深入讨论机器学习 8 大回归模型的基本原理以及差异!

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注