文章 2025-09-26 来自:开发者社区

DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读

DDMA-MIMO雷达多子带相干累积目标检测算法 W. Hong, S. Shen, Y. Zhang and J. Zhou, "Multiple Subbands Coherent Accumulation Target Detection Algorithm for DDMA-MIMO Radar," in IEEE Transactions on Intelligent Transp...

DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读
文章 2023-05-26 来自:开发者社区

绕开算力限制,如何用单GPU微调 LLM?这是一份「梯度累积」算法教程(2)

由于没有多的 GPU 可用于张量分片(tensor sharding),又能做些什么来训练具有更大批大小(batch size)的模型呢?其中一种解决方法就是梯度累积,可以通过它来修改前面提到的训练循环。什么是梯度积累?梯度累积是一种在训练期间虚拟增加批大小(batch size)的方法,当可用的 GPU 内存不足以容纳所需的批大小时,这非常有用。在梯度累积中,梯度是针对较小的批次计算的,并在多....

绕开算力限制,如何用单GPU微调 LLM?这是一份「梯度累积」算法教程(2)
文章 2023-05-26 来自:开发者社区

绕开算力限制,如何用单GPU微调 LLM?这是一份「梯度累积」算法教程

让算力资源用到极致,是每一位开发者的必修课。自从大模型变成热门趋势之后,GPU 就成了紧俏的物资。很多企业的储备都不一定充足,更不用说个人开发者了。有没有什么方法可以更高效的利用算力训练模型?在最近的一篇博客,Sebastian Raschka 介绍了「梯度累积」的方法,能够在 GPU 内存受限时使用更大 batch size 训练模型,绕开硬件限制。在此之前,Sebastian Raschka....

绕开算力限制,如何用单GPU微调 LLM?这是一份「梯度累积」算法教程

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

智能引擎技术

AI Online Serving,阿里巴巴集团搜推广算法与工程技术的大本营,大数据深度学习时代的创新主场。

+关注