文章 2024-08-13 来自:开发者社区

【机器学习】QLoRA:基于PEFT亲手量化微调Qwen2大模型

一、引言 之前陆续写了Qwen1.5、Qwen2.0、GLM-4等国产开源大模型的原理、训练及推理相关的文章,每一篇都拿到了热榜第一,但其中训练部分均基于Llama-factory框架,对于工程师而言,最喜欢的就是刨根问底,使用中间层的训练框架,还是少一些“安全感”。今天我们抛开中间框架,深入底层,一步一步带大家微调一个大模型。 二、量化与微调—原理剖析 2.1 为什么要...

【机器学习】QLoRA:基于PEFT亲手量化微调Qwen2大模型
问答 2024-07-23 来自:开发者社区

ModelScope未量化模型推理很快,双卡推理也很快,只有4卡非常慢,怎么解决?

ModelScope未量化模型推理很快,双卡推理也很快,只有4卡非常慢,怎么解决?

问答 2024-07-23 来自:开发者社区

awq量化模型,启动时,报图中警告,并且ModelScope模型推理速度非常慢,这应该怎么办?

"WARNING 07-16 14:51:24 config.py:244] awq quantization is not fully optimized yet. The speed can be slower than non-quantized models 使用awq量化模型,启动时,报图中警告,并且ModelScope模型推理速度非常慢,这应该怎么办?"

文章 2024-06-20 来自:开发者社区

机器学习之聚类——MeanShift算法和图像矢量量化

MeanShift:见名知意        大家英语怎么样,不好也没关系,没有人比百度更懂翻译。看看这个算法的名字,Mean和Shift紧紧相随,Mean的意思是平均值,Shift的意思是转移,挪动,可以更形象的解释为漂移。组合起来就是均值漂移。        MeanShift 这个概念最早是由...

机器学习之聚类——MeanShift算法和图像矢量量化
问答 2024-05-22 来自:开发者社区

modelscope中,量化后的模型推理报错吗?

"modelscope中,量化后的模型推理报错吗?"

问答 2023-12-04 来自:开发者社区

在ModelScope中,量化模型推理速度异常,可以帮忙看一下吗?

https://github.com/modelscope/swift/issues/184量化模型推理速度异常,可以帮忙看一下吗

文章 2023-06-22 来自:开发者社区

模型推理加速系列 | 03:Pytorch模型量化实践并以ResNet18模型量化为例(附代码)

更多、更新文章欢迎关注 微信公众号:小窗幽记机器学习。后续会持续整理模型加速、模型部署、模型压缩、LLM、AI艺术等系列专题,敬请关注。 量化基础知识 量化的本质是信息压缩,在深度学习中一般是降低参数精度。DNN中的参数过载使得其有更多的自由度或者说更多的选择来进行信息压缩。量化后的模型更小、运行效率更高,进而能够支持更高的吞吐量。较小的模型内存占用和能耗较低,是边缘部署的关键。 映射函数...

模型推理加速系列 | 03:Pytorch模型量化实践并以ResNet18模型量化为例(附代码)
文章 2022-02-15 来自:开发者社区

DIY图像压缩——机器学习实战之K-means 聚类图像压缩:色彩量化

更多深度文章,请关注:https://yq.aliyun.com/cloud 作者:ML bot2这篇文章是K均值聚类算法(K-means clustering)的一个简单应用:压缩图像。 在彩色图像中,每个像素的大小为3字节(RGB),可以表示的颜色总数为256 * 256 * 256。下图为1280 x 720像素的图像,采用PNG格式(一种无损压缩技术),大小为1.71 MB。 我们的目标....

DIY图像压缩——机器学习实战之K-means 聚类图像压缩:色彩量化

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注