文章 2025-10-03 来自:开发者社区

33_ LLM的定义与规模化:参数与计算力

引言:大语言模型的崛起与规模效应 在人工智能发展的长河中,2022年底ChatGPT的横空出世标志着大语言模型(LLM)时代的正式开启。自那时起,LLM技术以惊人的速度演进,从实验室走向产业应用,重塑着人类与计算机的交互方式。到2025年,全球LLMs已正式进入"模型即服务"(Maa...

33_ LLM的定义与规模化:参数与计算力
文章 2025-07-20 来自:开发者社区

AI-Compass LLM训练框架生态:整合ms-swift、Unsloth、Megatron-LM等核心框架,涵盖全参数/PEFT训练与分布式优化

AI-Compass LLM训练框架生态:整合ms-swift、Unsloth、Megatron-LM等核心框架,涵盖全参数/PEFT训练与分布式优化 AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供从完整学习路径。 github地址:AI-Compass:https://github.com/tin...

AI-Compass LLM训练框架生态:整合ms-swift、Unsloth、Megatron-LM等核心框架,涵盖全参数/PEFT训练与分布式优化
文章 2024-08-03 来自:开发者社区

公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4

最近,一篇关于语言模型(LLM)的论文引起了广泛关注。该论文提出了一种名为"公理训练"的新方法,通过该方法,一个只有6700万参数的LLM能够学会因果推理,并在多个任务上表现出与万亿参数级的GPT-4相媲美的性能。 论文中,研究人员首先指出了因果推理在现实世界中的重要性。他们指出&#...

问答 2024-07-04 来自:开发者社区

modelscope中关于用swift对LLM量化时,参数的含义咨询

https://modelscope.cn/docs/LLM%E9%87%8F%E5%8C%96%E6%96%87%E6%A1%A3 链接中对原始模型量化,类似这样的命令: CUDA_VISIBLE_DEVICES=0 swift export \ --model_type qwen1half-7b-chat --quant_bits 4 \ --dataset alpaca-z...

文章 2024-06-15 来自:开发者社区

从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗

最近,一篇名为“Scalable MatMul-free Language Modeling”的论文在人工智能领域引起了广泛关注。这篇论文提出了一种全新的方法,可以在不使用矩阵乘法(MatMul)的情况下,实现大规模语言模型(LLM)的高效训练和推理。 矩阵乘法是深度学习中最常用的操作之一ÿ...

文章 2024-03-15 来自:开发者社区

谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑

在人工智能领域,模型的规模和性能一直是推动技术进步的关键因素。随着计算能力的提升和算法的优化,AI模型变得越来越庞大,它们能够处理更复杂的任务,提供更精准的服务。然而,这些大模型往往需要强大的硬件支持,限制了它们在移动设备和个人电脑上的应用。谷歌最新发布的MediaPipe LLM Inference API,正是为了打破这一限制,让28亿参数的大模型也能在本地设备上流畅运行。 这一API的推.....

谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑
问答 2024-01-04 来自:开发者社区

OpenSearch LLM智能问答钉钉机器人对接怎么选择模型和自定义扩展参数?

OpenSearch LLM智能问答钉钉机器人对接怎么选择模型和自定义扩展参数?

问答 2023-08-13 来自:开发者社区

OpenSearch LLM智能问答 这个模型的选择,在http的接口参数里面没有看到,是不是没有?

OpenSearch LLM智能问答 这个模型的选择,在http的接口参数里面没有看到,是不是没有放出来?

问答 2023-08-13 来自:开发者社区

OpenSearch LLM智能问答接口header相关的参数说明文档没找到,能不能发一份?

OpenSearch LLM智能问答 https://help.aliyun.com/document_detail/2412580.html?spm=a2c4g.2392379.0.0.682964dddhHSOi 接口header相关的参数说明文档没找到,能不能发一份?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。