问答 2024-06-24 来自:开发者社区

Paraformer语音识别声学模型包含哪些主要组成部分?

Paraformer语音识别声学模型包含哪些主要组成部分?

问答 2024-06-24 来自:开发者社区

如何体验通义语音实验室的RWKV-RNN-T语音识别声学模型?

如何体验通义语音实验室的RWKV-RNN-T语音识别声学模型?

问答 2024-06-24 来自:开发者社区

RWKV-RNN-T语音识别声学模型在实时语音识别中有什么优势?

RWKV-RNN-T语音识别声学模型在实时语音识别中有什么优势?

问答 2024-06-24 来自:开发者社区

通义语音实验室提出的Paraformer语音识别声学模型有哪些主要特点和优势?

通义语音实验室提出的Paraformer语音识别声学模型有哪些主要特点和优势?

文章 2018-03-16 来自:开发者社区

3月16日云栖精选夜读:显著超越流行长短时记忆网络,阿里提出DFSMN语音识别声学模型

在语音顶会ICASSP,阿里巴巴语音交互智能团队的poster论文提出一种改进的前馈序列记忆神经网络结构,称之为深层前馈序列记忆神经网络(DFSMN)。研究人员进一步将深层前馈序列记忆神经网络和低帧率(LFR)技术相结合,构建LFR-DFSMN语音识别声学模型。 热点热议 显著超越流行长短时记忆网络,阿里提出DFSMN语音识别声学模型 作者:技术小能手 全球最大独立音乐版权商首次进军中国,为...

文章 2018-03-16 来自:开发者社区

显著超越流行长短时记忆网络,阿里提出DFSMN语音识别声学模型

在语音顶会ICASSP,阿里巴巴语音交互智能团队的poster论文提出一种改进的前馈序列记忆神经网络结构,称之为深层前馈序列记忆神经网络(DFSMN)。研究人员进一步将深层前馈序列记忆神经网络和低帧率(LFR)技术相结合,构建LFR-DFSMN语音识别声学模型。 该模型在大词汇量的英文识别和中文识别任务上都可以取得相比于目前最流行的基于长短时记忆单元的双向循环神经网络(BLSTM)的识别系统显著....

显著超越流行长短时记忆网络,阿里提出DFSMN语音识别声学模型
文章 2017-12-02 来自:开发者社区

INTERSPEECH 2017系列 | 语音识别技术之声学模型

编者:今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。从10月25日开始,阿里iDST语音团队和云栖社区将共同打造一系列语音技术分享会,旨在为大家分享INTERSPEECH2017会议上语音技术各个方面的进展。本期分享的主题是远场....

文章 2017-11-16 来自:开发者社区

语音识别中声学模型得分计算优化方法

摘要          语音是人们沟通交流最直接、最自然的交互方式。自计算机问世以来,人们就一直希望可以通过语音实现人和计算机之间的交互,而语音识别技术,目标就是通过把人类的语音中的词汇内容转换为相应的文本,架起了人机交互的桥梁。对于一个语音识别系统,速度和精度是两个核心指标,直接决定着系统是否可用。其中,识别速度的提...

文章 2017-10-20 来自:开发者社区

人机交互新进展:LFR-DFSMN语音识别声学模型介绍

语音识别技术是人机交互技术的重要组成部分,而语音识别中的声学模型是语音识别技术中的核心所在,堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果,实现了语音识别的迭代速度、识别成本、服务质量的全面提升。 一、语音识别背景介绍   语音...

文章 2017-08-03 来自:开发者社区

深度学习在语音识别中的声学模型以及语言模型的应用

         过去 3 年,深度学习在各个领域取得较大突破,比如计算机视觉领域的物体识别、场景分类,语音分析等,并且其技术推广和应用的速度超过人们预期,比如 Google 的广告系统已经开始使用深度学习盈利,Twitter 也通过深度学习改善App 图片及视频内容服务体验。那具体何为深度学习呢?深度学习是怎么应用在上述的各个领域呢,下面结合自身...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐