阿里云文档 2025-01-15

语音分析音频性别识别SDK接口说明

性别识别功能用于识别音频中说话人的性别(男或女)。

阿里云文档 2024-12-26

百炼语音模型服务有哪些API

概述Paraformer语音识别提供的文件转写API,能够对常见的音频或音视频文件进行语音识别,并将结果返回给调用者。常见的音频或音视频文件一般采用16kHz及以上的采样率进行录制,可选择paraformer-v1模型进行中英文语音识别,或选择paraformer-MTL-v1模型对超过20种语言及...

阿里云文档 2024-12-26

如何快速调用百炼语音模型服务

本文为您介绍如何快速调用百炼语音模型服务。

问答 2024-08-21 来自:开发者社区

阿里巴巴语音实验室SAN-M网络结构和SCAMA流式Attention机制在语音识别中起什么作用?

阿里巴巴语音实验室提出的SAN-M网络结构和SCAMA流式Attention机制在语音识别中起到了什么作用?

问答 2024-08-19 来自:开发者社区

阿里巴巴语音实验室提出的SAN-M网络结构和流式Attention机制在语音识别中起到了什么作用?

阿里巴巴语音实验室提出的SAN-M网络结构和SCAMA流式Attention机制在语音识别中起到了什么作用?

阿里云文档 2024-04-24

如何下载安装、使用语音分析音频性别识别Java SDKSDK代码示例

本文介绍如何使用阿里云智能语音服务提供的Java SDK,包括SDK的安装方法及SDK代码示例。

问答 2023-04-14 来自:开发者社区

语音论文阅读(基于Transformer的在线CTC/Attention 端到端语音识别架构)

【技术揭秘】可控时延语音识别文本后处理技术 论文:         Conformer: Convolution-augmented Transformer for Speech Recognition 摘要:      ...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐