阿里云文档 2025-06-07

Paraformer实时语音识别WebSocket API

本文介绍如何通过WebSocket连接访问实时语音识别服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Paraformer实时语音识别应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端和服务器通过...

阿里云文档 2025-05-15

Gummy实时语音识别、翻译WebSocket API

本文介绍如何通过WebSocket连接访问Gummy实时语音识别、翻译服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Gummy实时语音识别、翻译应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端...

阿里云文档 2025-05-12

实时语音识别

实时语音识别可以将音频流实时转换为文本,实现“边说边出文字”的效果。它适用于对麦克风语音进行实时识别,以及对本地音频文件进行实时转录。

阿里云文档 2025-03-28

高并发场景下实时语音识别的性能优化

本文介绍在高并发场景下,如何通过DashScope Java SDK,高效调用Paraformer实时语音识别服务。

文章 2025-01-20 来自:开发者社区

昇腾AI行业案例(七):基于 Conformer 和 Transformer 模型的中文语音识别

00 - 前言 欢迎学习《基于 Conformer 和 Transformer 模型的中文语音识别》实验。本案例旨在帮助你深入了解如何运用深度学习模型搭建一个高效精准的语音识别系统,将中文语音信号转换成文字,并利用开源数据集对模型效果加以验证。 学习目标 在本课程中,您将学习如下内容: 语音数据预处理的方法 使用AI模型对语音数据进行预测推理的流程 ...

昇腾AI行业案例(七):基于 Conformer 和 Transformer 模型的中文语音识别
文章 2024-10-17 来自:开发者社区

超越传统模型:探讨门控循环单元(GRU)在语音识别领域的最新进展与挑战

随着人工智能技术的不断进步,语音识别已经从一个相对小众的研究领域发展成为日常生活中的常见技术。无论是智能手机上的语音助手,还是智能家居设备,甚至是自动字幕生成系统,都离不开高质量的语音识别技术的支持。在众多用于语音识别的技术中,基于深度学习的方法尤其是递归神经网络(RNNs)及其变体如长短期记忆网络...

超越传统模型:探讨门控循环单元(GRU)在语音识别领域的最新进展与挑战
问答 2024-06-24 来自:开发者社区

RWKV-RNN-T语音识别声学模型在实时语音识别中有什么优势?

RWKV-RNN-T语音识别声学模型在实时语音识别中有什么优势?

问答 2024-04-10 来自:开发者社区

modelscope-funasr哪个模型支持离线实时语音识别的呀?

modelscope-funasr哪个模型支持离线实时语音识别的呀?我用这个模型"speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx"识别一个3s的语音需要2s中,不知道有没有更快一点的呢?

文章 2024-03-30 来自:开发者社区

Hotword模型在语音识别系统中定义为能够识别特定关键词或短语(也称为唤醒词)的模型

Hotword模型在语音识别系统中定义为能够识别特定关键词或短语(也称为唤醒词)的模型,它允许设备或应用程序在接收到唤醒词时激活语音识别功能。在ModelScope-FunASR的ASR(自动语音识别)组件中,Hotword模型作为预处理的一部分,用于检测音频片段中是否存在特定的唤醒词。 为了定义和...

问答 2024-01-24 来自:开发者社区

modelscope-funasr 这个模型可以到中文流式语音识别服务(CPU版本)里面使用吗?

modelscope-funasr 这个模型可以到中文流式语音识别服务(CPU版本)里面使用吗?speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐