阿里云文档 2026-06-17

简介与SDK代码示例

CosyVoice声音复刻服务依托先进的大模型技术进行特征提取,从而完成声音的复刻,且无需训练过程。仅需提供时长较短的音频,即可迅速生成高度相似且听感自然的定制声音。本文将详细介绍CosyVoice声音复刻服务的使用方法和操作流程,帮助您快速实现声音复刻。

阿里云文档 2026-06-17

移动端访问智能语音交互服务

为了避免在移动端App或者桌面端工具中保存固定AccessKey ID和AccessKey Secret可能引起的泄露风险,您可以通过在App服务端创建Token并下发到移动端使用,或使用STS临时访问凭证调用语音服务两种方式,更加安全地访问智能语音交互服务。

阿里云文档 2026-06-16

Paraformer实时语音识别WebSocket API

本文介绍通过 WebSocket 连接访问 Paraformer 实时语音识别服务的服务端点、请求头和交互流程。

阿里云文档 2025-01-17

通义听悟实时流是魔笔平台提供的一种实时语音识别服务

魔笔平台提供了强大的通义听悟实时流功能,让您能够轻松完成通义听悟实时推流的能力。本文档将指导您如何使用通义听悟实时流集成。

问答 2024-01-24 来自:开发者社区

modelscope-funasr中文流式语音识别服务(CPU版本)里面有可以替换的说话人模型吗?

modelscope-funasr中文流式语音识别服务(CPU版本)里面有可以替换的说话人模型吗?

问答 2024-01-24 来自:开发者社区

modelscope-funasr 这个模型可以到中文流式语音识别服务(CPU版本)里面使用吗?

modelscope-funasr 这个模型可以到中文流式语音识别服务(CPU版本)里面使用吗?speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn

文章 2023-06-27 来自:开发者社区

阿里云语音识别服务提供了三个版本的录音文件识别

阿里云语音识别服务提供了三个版本的录音文件识别:流式识别、实时识别和文件识别。这三个版本在使用场景、识别速度、识别精度等方面有所不同。 流式识别 流式识别适用于实时语音识别场景,可以实时识别用户说话的内容,并返回识别结果。流式识别采用流式传输的方式,支持长时间识别,并且可以在识别过程中实时返回中间结果。流式识别的识别速度较快&...

阿里云文档 2022-07-14

智能语音交互服务返回403错误码

问题描述在使用阿里云智能语音交互服务时,返回403错误码。问题原因调用智能语音交互服务的访问令牌(Access Token)过期或无效的参数。解决方案首先检查使用的令牌是否过期,然后检查参数值设置是否合理,详情请参见获取Token。获取Token适用于智能语音交互

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐