文章 2024-08-13 来自:开发者社区

AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战

一、引言 5月6日私募基金幻方发布DeepSeek-V2,千亿级模型,每百万Tokens仅需1元-2元。5月15日,字节发布白菜价的豆包大模型,5月21日阿里、百度相机大幅下调甚至免费开放自家商用模型接口,大模型价格战正式打响。而被誉为大模型价格屠夫的“DeepSeek-V2”到底是怎么个事儿,是否可以进行训练和推理,今天我们来展开讲一讲。 二、模型简介 2.1 Deep...

AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战
问答 2024-06-27 来自:开发者社区

Agent 推理方式中的代理类型决定了什么?

Agent 推理方式中的代理类型决定了什么?

文章 2024-05-14 来自:开发者社区

专业智能体指导让小模型学会数学推理!微调Mistral-7B实现86.81%准确率

最近,一项名为Orca-Math的研究引起了广泛关注,该研究展示了如何使用小语言模型(SLM)解决小学数学问题。数学问题解决一直被认为是一项复杂的任务,对于SLM来说尤其具有挑战性。然而,Orca-Math通过使用一种创新的方法,成功地将一个只有70亿参数的SLM在GSM8K基准测试上的准确率提高到...

文章 2024-04-20 来自:开发者社区

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

随着人工智能技术的飞速发展,大型语言模型(LLMs)在各个领域的应用日益广泛,特别是在数据科学任务中,它们展现出了巨大的潜力。最近,一项名为DS-Agent的研究引起了广泛关注,该研究通过结合案例推理(CBR)和大型语言模型,显著提升了自动化数据科学任务的效...

问答 2024-03-03 来自:开发者社区

ModelScope中我上次将agent 使用训练数据跑通了,训练结束后产出一个模型,怎么加载推理?

ModelScope中我上次将agent 使用训练数据跑通了,训练结束后产出一个模型,但是我不知道咋用llm-infer.py 去加载和推理模型?运行llm-infer.py需要参数和文件这个我不知道在哪里?文档也没有给出。显存为32g,Qiwen7b这个,我的在D盘。

文章 2023-12-21 来自:开发者社区

视觉Agent来了!智谱AI开源CogAgent,支持GUI图形界面问答(附魔搭推理微调最佳实践)

$stringUtil.substring( $!{XssContent1.description},200)...

视觉Agent来了!智谱AI开源CogAgent,支持GUI图形界面问答(附魔搭推理微调最佳实践)
问答 2023-10-19 来自:开发者社区

请教一个问题,用modelscope agent开源版的QA推理响应很慢,差不多20s+?

请教一个问题,用modelscope agent开源版的QA推理响应很慢,差不多20s+, 返回的长度也不多,同样的问题发送给在线版本响应就很快,哪里可以优化吗?我部署的是A10 24G,同样用Qwen-7B推理还是蛮快的

问答 2023-09-19 来自:开发者社区

在ModelScope中,ms-agent本地部署之后,推理速度有点慢,能给点优化建议吗?

在ModelScope中,ms-agent本地部署之后,推理速度有点慢,能给点优化建议吗?

文章 2017-07-03 来自:开发者社区

《人工智能:计算Agent基础》——第二部分 表达和推理第3章 状态和搜索3.1 用搜索进行问题求解

$stringUtil.substring( $!{XssContent1.description},200)...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐