文章 2025-01-16 来自:开发者社区

淘天算法工程师玩转《黑神话》,多模态大模型如何成为天命AI

最近,基于大型语言模型 (LLM) 的Agent在各个领域取得了重大进展。最受欢迎的研究领域之一是将这些Agent应用于电子游戏上。 传统的方法往往依赖于游戏的API来通过内存访问游戏内环境和动作数据。然而,这种方法受到API可用性的限制,并且不能反映人类玩游戏的方式。 此外,在动作角色扮演游戏 (ARPG) 中,基于强化学习 (RL) 的方法很普遍,但其泛化能力较差,需要大...

淘天算法工程师玩转《黑神话》,多模态大模型如何成为天命AI
文章 2024-08-18 来自:开发者社区

让非算法同学也能了解 ChatGPT 等相关大模型

本文来源:支付宝体验科技 ‍♀️ 编者按:本文作者是蚂蚁集团前端工程师茂松,从非算法同学的视角窥探大模型的理论和实践,欢迎查阅~   前言 当前 LLM(Large Language Mod...

让非算法同学也能了解 ChatGPT 等相关大模型
文章 2024-06-19 来自:开发者社区

【机器学习】RLHF:在线方法与离线算法在大模型语言模型校准中的博弈

一、引言 在人工智能领域,大型语言模型(LLM)的校准已成为一个备受关注的热点。基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,简称RLHF)作为一种有效的校准方法,已逐渐在GPT-4、ChatGPT等先进模型中展现出其独特优势。然而,随着离线对齐算法的迅速崛起,RLHF所面临的挑战也日益严峻。本文将从RLHF的基本概念入手,...

【机器学习】RLHF:在线方法与离线算法在大模型语言模型校准中的博弈
文章 2024-06-13 来自:开发者社区

让非算法同学也能了解 ChatGPT 等相关大模型

本文来源:支付宝体验科技公众号 ‍♀️ 编者按:本文作者是蚂蚁集团前端工程师茂松,从非算法同学的视角窥探大模型的理论和实践,欢迎查阅~   前...

让非算法同学也能了解 ChatGPT 等相关大模型
文章 2024-03-15 来自:开发者社区

当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”

在人工智能领域,大型语言模型(LLMs)以其强大的自然语言处理能力而备受关注。然而,这些模型在处理复杂问题时,尤其是在面对重复性子任务或包含误导性信息的场景中,常常表现出力不从心。为了提升LLMs的问题解决能力,南加州大学与微软亚洲研究院的研究团队提出了一种创新的方法:将分治算法(Divide-and-Conquer,DaC)与prompt策略相结合,以增强模型在识别和解决复杂问题时的准确性。 ....

当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”
文章 2023-06-29 来自:开发者社区

7 Papers | DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU

目录:Faster sorting algorithms discovered using deep reinforcement learningVideo-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video UnderstandingPatch-based 3D Natural Scene Generation f....

7 Papers | DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU
文章 2023-02-09 来自:开发者社区

浪潮信息AI算法研究员:解读人工智能大模型在产业中的服务新态势 | 龙蜥技术

编者按:最早人工智能的模型是从 2012 年(AlexNet)问世,模型的深度和广度一直在逐级扩升,龙蜥社区理事单位浪潮信息于 2021 年 9 月也发布了大规模预训练模型——源 1.0。今天,浪潮信息 AI 算法研究员李峰带大家了解大模型发展现状和大模型基础知识,交流大模型在产业应用中起到的作用和 AI 服务新态势。本文整理自龙蜥大讲堂第 60 期,以下为本次分享原文:01 大模型现状大家可以....

浪潮信息AI算法研究员:解读人工智能大模型在产业中的服务新态势 | 龙蜥技术
文章 2023-01-11 来自:开发者社区

浪潮信息分享:新型算法基础设施大模型的知识蒸馏技术介绍 | 第 60 期

本周「龙蜥大讲堂」预告来啦!龙蜥社区邀请了浪潮信息 AI 算法研究员李峰做《基于源 1.0 预训练大模型的知识蒸馏技术》分享,快来扫码入群,预定前排小板凳观看直播!直播主题及内容介绍直播主题:基于源 1.0 预训练大模型的知识蒸馏技术直播时间:2023 年 01 月 11 日(周三)16:00-17:00直播内容:本次直播介绍大模型发展现状及浪潮信息在中文自然语言大模型领域的最佳实践,并针对大模....

浪潮信息分享:新型算法基础设施大模型的知识蒸馏技术介绍 | 第 60 期
文章 2022-04-27 来自:开发者社区

阿里云机器学习PAI开源中文NLP算法框架EasyNLP,助力NLP大模型落地

作者:临在、岑鸣、熊兮一 导读随着 BERT、Megatron、GPT-3 等预训练模型在NLP领域取得瞩目的成果,越来越多团队投身到超大规模训练中,这使得训练模型的规模从亿级别发展到了千亿甚至万亿的规模。然而,这类超大规模的模型运用于实际场景中仍然有一些挑战。首先,模型参数量过大使得训练和推理速度过慢且部署成本极高;其次在很多实际场景中数据量不足的问题仍然制约着大模型在小样本场景中的应用,提高....

阿里云机器学习PAI开源中文NLP算法框架EasyNLP,助力NLP大模型落地

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

智能搜索推荐

智能推荐(Artificial Intelligence Recommendation,简称AIRec)基于阿里巴巴大数据和人工智能技术,以及在电商、内容、直播、社交等领域的业务沉淀,为企业开发者提供场景化推荐服务、全链路推荐系统开发平台、工程引擎组件库等多种形式服务,助力在线业务增长。

+关注