文章 2024-12-08 来自:开发者社区

【AI系统】训练后量化与部署

本文将会重点介绍训练后量化技术的两种方式:动态和静态方法,将模型权重和激活从浮点数转换为整数,以减少模型大小和加速推理。并以 KL 散度作为例子讲解校准方法和量化粒度控制来平衡模型精度和性能。 训练后量化的方式 训练后量化的方式主要分为动态和静态两种。 动态离线量化 动态离线量化(Post Training Quantization Dynamic, PTQ Dynamic)仅将模型中特定算子的....

【AI系统】训练后量化与部署
文章 2024-12-08 来自:开发者社区

【AI系统】感知量化训练 QAT

本文将会介绍感知量化训练(QAT)流程,这是一种在训练期间模拟量化操作的方法,用于减少将神经网络模型从 FP32 精度量化到 INT8 时的精度损失。QAT 通过在模型中插入伪量化节点(FakeQuant)来模拟量化误差,并在训练过程中最小化这些误差,最终得到一个适应量化环境的模型。 文中还会讨论伪量化节点的作用、正向和反向传播中的处理方式,以及如何在 TensorRT 中使用 QAT 模型进行....

【AI系统】感知量化训练 QAT
文章 2024-09-26 来自:开发者社区

智能ai量化高频策略交易软件、现货合约跟单模式开发技术规则

智能AI量化高频策略交易软件及现货合约跟单模式的开发是一个复杂且技术密集型的项目,它结合了人工智能、量化交易、软件开发等多个领域的知识。以下是对这两个方面开发的详细解析: 一、智能AI量化高频策略交易软件开发 明确目标与需求分析: 确定开发目标,包括预期功能、性能指标、用户群体等。 进行详细的需求分析,包括用户需求、市场需求、技...

文章 2024-06-17 来自:开发者社区

AI大模型量化

AI大模型量化是一种优化模型大小和计算效率的方法。它通过减少模型参数和降低模型精度,从而在保持相对较高性能的同时,降低了模型的存储需求和计算开销。   #动态量化 import torch import torch.nn as nn import torch.quan...

文章 2024-02-21 来自:开发者社区

南京大学提出量化特征蒸馏方法QFD | 完美结合量化与蒸馏,让AI落地更进一步!!!

神经网络量化旨在通过使用低位近似加速和修剪全精度神经网络模型。采用量化感知训练(QAT)范式的方法最近有了快速增长,但往往在概念上较为复杂。 本文提出了一种新颖而高效的QAT方法,即量化特征蒸馏(QFD)。QFD首先将量化(或二值化)表示作为教师进行训练,然后使用知识蒸馏(KD)对网络进行量化。 定量结果表明,QFD比先前的量化方法更灵活且更有效(即更适合量化)。QFD在图像...

南京大学提出量化特征蒸馏方法QFD | 完美结合量化与蒸馏,让AI落地更进一步!!!
文章 2023-12-19 来自:开发者社区

极智AI | 三谈昇腾CANN量化

大家好,我是极智视界,本文介绍一下 三谈昇腾CANN量化。在之前我已经从原理和命令行的量化执行方面介绍了昇腾CANN的量化,有兴趣的同学可以去查看,附上:《谈谈昇腾CANN量化》 ==> 昇腾CANN量化原理;《再谈昇腾CANN量化》 ==> 昇腾CANN命令行量化执行;这里我们来谈谈CANN量化的Python API,当然这跟命令行的量化执行一样,功能上也是进行量化操作。先来一个r....

极智AI | 三谈昇腾CANN量化
文章 2023-12-19 来自:开发者社区

极智AI | 再谈昇腾CANN量化

大家好,我是极智视界,本文介绍一下 再谈昇腾CANN量化。在上一篇已经介绍了昇腾CANN量化的原理,对于原理或公式推导有兴趣的同学可以去看一看:《谈谈昇腾CANN量化》。这篇咱们继续,来谈谈昇腾CANN量化的命令行操作。要进行量化操作,首先要安装好量化环境,这里先简单介绍一下量化环境的安装:# (1) Anacona3安装,用conda管理python环境,略过 # (2) conda创建amc....

极智AI | 再谈昇腾CANN量化
文章 2023-12-19 来自:开发者社区

极智AI | 谈谈昇腾CANN量化

大家好,我是极智视界,本文介绍一下 谈谈昇腾CANN量化。昇腾CANN的量化体现在AMCT工具,也即模型压缩工具,后面再来说AMCT,这篇先聊一下昇腾CANN的量化执行流程和原理。量化是指对原始框架的模型权重weights 和 数据activation 进行低比特化int8的处理,以此可以达到的优化效果如下:量化分为训练后量化(Post-Training Quantization) 和 量化感知....

极智AI | 谈谈昇腾CANN量化
文章 2023-12-19 来自:开发者社区

极智AI | ncnn模型转换及量化流程

本文介绍一下 ncnn 模型转换及量化流程,以 from_darknet yolov4 为例。关于 ncnn 的 ubuntu 和 windows 安装方法可以参考我之前写的:《【嵌入式AI】ubuntu 安装 ncnn》、《【经验分享】win10 qmake 构建 ncnn vs 工程》。1、模型转换./darknet2ncnn yolov4.cfg yolov4.weights yolov4....

极智AI | ncnn模型转换及量化流程
文章 2023-12-19 来自:开发者社区

极智AI | 谈谈为什么量化能加速推理

本文主要讨论一下为什么量化能加速模型推理。前面已经写过几篇关于模型量化相关的文章:《【模型推理】谈谈几种量化策略:MinMax、KLD、ADMM、EQ》、《【模型推理】谈谈模型量化组织方式》、《【模型推理】谈谈非线性激活函数的量化方式》,要了解相关知识可以查阅,这里主要讨论一下为什么量化能加速模型推理。量化经常会涉及到 Quantize 和 Dequantize 的过程,其实对于不量化的 flo....

极智AI | 谈谈为什么量化能加速推理

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"productCardStyle","productCode":"aliyun","productCardInfo":{"productTitle":"阿里云 AI","productDescription":"从 AI 应用构建,模型部署到训练,一站式了解阿里云经典的 AI 应用场景和解决方案。","productContentLink":"https://www.aliyun.com/solution/tech-solution/ai","isDisplayProductIcon":true,"productButton1":{"productButtonText":"查看详情","productButtonLink":"https://www.aliyun.com/solution/tech-solution/ai"},"productButton2":{"productButtonText":"联系 AI 专家","productButtonLink":"https://page.aliyun.com/form/act933288178/index.htm?spm=5176.29311086.J_RY_4Q8--sru4dMV7o3lqS.2.22ec5297YL7w86"},"productButton3":{"productButtonText":"立即体验","productButtonLink":"https://bailian.console.aliyun.com/?spm=5176.28326591.0.0.56136ee1bpor89#/efm/model_experience_center"},"productPromotionInfoBlock":[{"$id":"0","productPromotionGroupingTitle":"热门体验","productPromotionInfoFirstText":"文生文应用","productPromotionInfoFirstLink":"https://bailian.console.aliyun.com/?spm=5176.29311086.J__xR9sQs7AmaTHLBTgN3VS.1.22ec52978mJi5p#/home","productPromotionInfoSecondText":"文生图应用","productPromotionInfoSecondLink":"https://bailian.console.aliyun.com/?spm=5176.29311086.J__xR9sQs7AmaTHLBTgN3VS.2.22ec52978mJi5p#/efm/model_experience_center?modelId=wanx-v1"},{"$id":"1","productPromotionGroupingTitle":"热门产品","productPromotionInfoFirstText":"大模型服务平台百炼","productPromotionInfoFirstLink":"https://www.aliyun.com/product/bailian","productPromotionInfoSecondText":"人工智能平台 PAI","productPromotionInfoSecondLink":"https://www.aliyun.com/product/bigdata/learn"},{"$id":"2","productPromotionGroupingTitle":"技术解决方案","productPromotionInfoFirstText":"向量检索与通义千问搭建专属问答服务","productPromotionInfoFirstLink":"https://www.aliyun.com/solution/tech-solution/dashvector","productPromotionInfoSecondText":"创意加速器:AI 绘画创作","productPromotionInfoSecondLink":"https://www.aliyun.com/solution/tech-solution/tongyi-wanxiang"},{"$id":"3","productPromotionGroupingTitle":"热门模型","productPromotionInfoFirstText":"通义千问","productPromotionInfoFirstLink":"https://tongyi.aliyun.com","productPromotionInfoSecondText":"通义万相","productPromotionInfoSecondLink":"https://tongyi.aliyun.com/wanxiang"}],"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"","activityDescription":"","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock","activityPromotionInfoBlock":[]}}

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注