文章 2024-10-15 来自:开发者社区

ACL杰出论文奖:GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集,全面提升大模型心智能力

最近,一篇荣获ACL杰出论文奖的研究引起了广泛关注。该研究由约翰斯•霍普金斯大学(JHU)等机构联合发布,旨在解决当前大模型在心智能力上的缺陷。他们提出了首个多模态心智理论(ToM)测试集——MMToM-QA,为全面提升大模型的心智能力提供了新的思路和方法。 心智理论(ToMÿ...

文章 2024-08-03 来自:开发者社区

测试使用SenseVoice大模型测评

测试使用SenseVoice大模型测评 开通产品: 采用按量付费方式开通智能外呼机器人服务。如需后续转为并发包月形式,可联系运营人员调整。< 构建场景: 进入【场景管理】,创建新的场景和对话流程。设计对话流程时,参考相关文档以确保场景逻辑的合理性,完成后保存设置。 测试功能: 文本对话窗测试:利用测试窗口输入文本进行初步测...

测试使用SenseVoice大模型测评
文章 2024-08-01 来自:开发者社区

测试FunAudioLLM在性能、功能、技术先进性等跟国际知名语音大模型进行比较。

在性能、功能和技术先进性方面,FunAudioLLM与国际知名语音大模型相比,有着独特的优势和特点。 一、性能比较 语音识别性能:FunAudioLLM通过SenseVoice模型实现了高精度的多语言语音识别。在测试中,其识别准确率与国际领先的模型如Whisper相比,有着显著的提升,特别是在中文和粤语等特定语言...

问答 2024-07-25 来自:开发者社区

如何测试大模型进行内容审核?

如何测试大模型进行内容审核?

问答 2024-07-24 来自:开发者社区

我要测试大模型,用于内容审核,我应该如何操作?

我要测试大模型,用于内容审核,我应该如何操作?

问答 2024-07-24 来自:开发者社区

要不通过API直接测试大模型有具体的操作步骤么?

要不通过API直接测试大模型有具体的操作步骤么?

文章 2024-04-07 来自:开发者社区

人工智能,应该如何测试?(八)企业级智能客服测试大模型 RAG

大模型的缺陷 – 幻觉 接触过 GPT 这样的大模型产品的同学应该都知道大模型的强大之处, 很多人都应该调戏过 GPT,跟 GPT 聊很多的天。 作为一个面向大众的对话机器人,GPT 明显是鹤立鸡群,在世界范围内还没有看到有能跟 GPT 扳手腕的存在。 也许很多人都认为 GPT 是非常强大的对话机器人了, 它学时丰富,什么领域内的问题都能回答。但其实就如我上一篇帖子中说道的, 虽然这种大模型看.....

人工智能,应该如何测试?(八)企业级智能客服测试大模型 RAG
文章 2024-04-07 来自:开发者社区

人工智能,应该如何测试?(七)大模型客服系统测试

知识引擎 我们在生活中应该多多少少接触过对话机器人,比如我们都知道很多客服其实都是机器人先档在前面回答用户问题的, 有些机器人有相当程度的知识储备, 比如你去买了一辆车, 然后想咨询客服这辆车的保险的细节。 你就会问: 请问车的每年的保险费是多少钱。 但很多时候不同的车型,年份等其他细节会决定了保险费的价格。这时候机器人要通过问询的形式收集这些信息(我们管这些信息叫词槽),所以机器人要先识别用.....

人工智能,应该如何测试?(七)大模型客服系统测试
文章 2024-04-07 来自:开发者社区

人工智能,应该如何测试?(一)基础效果篇(内含大模型的测试内容)

前言 这个系列算是科普文吧,尤其这第一篇可能会比较长,因为我这 8 年里一直在 AI 领域里做测试,涉及到的场景有些多, 我希望能尽量把我经历过的东西都介绍一下,算是给大家科普一下我们这些在 AI 领域内做测试的人,每天都在做什么事情。 当然 AI 领域很庞杂,我涉及到的可能也仅仅是一小部分,这篇帖子算是抛砖引玉,欢迎大家一起来讨论。 我打算先简单讲解一下人工智能的原理,毕竟后面要围绕这些去...

人工智能,应该如何测试?(一)基础效果篇(内含大模型的测试内容)
文章 2024-03-19 来自:开发者社区

LLM的测试工具:LaVague平替成国内大模型

LLM的测试工具:LaVague平替成国内大模型 laVague 是将自然语言转化成浏览器交互的操作,完成自动化测试的大模型的agent。 LaVague介绍 LaVague 通过LLM将自然语言转换Selenium的代码引擎,用户或其他人工智能轻松实现自动化。LaVague通过Llama Index实现了自然语言到python的selenium代码的编写能力,例子中提供了在线调...

LLM的测试工具:LaVague平替成国内大模型

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注