问答 2025-01-26 来自:开发者社区

通义千问语音识别大模型API 本地上传报错 InvalidParameter问题如何解决?

在使用通义千问ASR时,是否支持直接上传本地音频文件?如果支持,是否必须使用官方DashScope SDK,或者可以通过 Base64 编码等方式上传?当前尝试通过 multipart/form-data 和 Base64 编码上传本地文件,但遇到 InvalidParameter 错误。但是使用公网 URL响应正常。请问正确的本地上传方式是什么?是否需要特定的字段名或编码格式?附错误信息:re....

文章 2023-05-24 来自:开发者社区

谷歌的野心:通用语音识别大模型已经支持100+语言

谷歌表示,推出通用语音模型(USM)是其未来支持 1000 种语言的关键一步。 去年 11 月,谷歌宣布推出「1000 种语言计划」,旨在构建一个机器学习 (ML) 模型,支持世界上使用最广泛的 1000 种语言,从而为全球数十亿人带来更大的包容性。然而,其中一些语言的使用人数不到两千万,因此核心挑战是如何支持使用人数相对较少或可用数据有限的语言。现在,谷歌公开了更多有关通用语音模型 (...

谷歌的野心:通用语音识别大模型已经支持100+语言

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐