阿里云文档 2024-09-23

流式文本语音合成使用说明

流式文本语音合成功能可以将您输入的文本合成为语音二进制数据,相比于非流式语音合成,流式合成的优势在于实时性更强,用户在输入文本的同时就可以听到接近同步的语音输出,极大地提升了交互体验,减少了用户等待时间。适用于大规模语言模型的逐字输入型、流式文本入参形式的场景。

阿里云文档 2024-04-25

语种识别SDK接口说明及支持的语种

语种识别功能用于识别音频中语言种类,目前支持中、英、粤三个语种。

阿里云文档 2024-02-28

实时长文本语音合成SDK接口和错误码信息

长文本语音合成功能提供了将超长文本(如千字或者万字)合成为语音二进制数据的功能。

阿里云文档 2023-11-17

说话人识别SDK接口说明

说话人识别功能可以将说话人所读出的连续数字串语音,与语音库中该用户ID所对应的声音特征进行1:1比对验证,当声音特征比对满足阈值条件时则身份验证成功。

阿里云文档 2023-11-17

语音分析音频性别识别SDK接口说明

性别识别功能用于识别音频中说话人的性别(男或女)。

问答 2022-08-11 来自:开发者社区

智能语音应用语音适配pcm_aec_control接口有什么参数?

智能语音应用语音适配pcm_aec_control接口有什么参数?

问答 2022-08-11 来自:开发者社区

智能语音应用语音适配pcm_aec_control接口有什么功能?

智能语音应用语音适配pcm_aec_control接口有什么功能?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。