文章 2024-06-27 来自:开发者社区

GigaSpeech 2:三万小时东南亚多语种语音识别开源数据集发布

“Giga”一词源于“gigantic”,互联网上具有海量音频资源,但语音质量良莠不齐,高质量音频文本对数据十分稀缺且标注成本高昂,特别是在小语种领域。GigaSpeech 是一个非常成功的英文开源数据集,以 YouTube 和 Podcast 为音频来源,提供了上万小时的高质量文本标注语音数据集,获得了广泛关注和应用。针对多语言领域仍存在的语音识别性能较差、可用高质量标注数据缺乏等问题,我们提....

GigaSpeech 2:三万小时东南亚多语种语音识别开源数据集发布
问答 2024-02-01 来自:开发者社区

modelscope-funasr语音识别,有哪些开源的数据集吗?

modelscope-funasr语音识别,有哪些开源的数据集吗?

问答 2023-05-30 来自:开发者社区

ModelScope有语音识别的自定义数据集吗?不太了解结构,弄起来报错

ModelScope有语音识别的自定义数据集吗?不太了解结构,弄起来报错

问答 2023-03-01 来自:开发者社区

Paraformer语音识别-中文-通用-16k-离线-large-pytorch有对应数据集吗

Paraformer语音识别-中文-通用-16k-离线-large-pytorch有对应数据集吗

文章 2018-11-15 来自:开发者社区

云从科技刷新一项语音识别纪录:将 Librispeech 数据集上的错词率降至 2.97%

云从科技 +4 AI影响因子 活动 企业:云从科技 操作:刷新记录 事项:云从科技刷新一项语音识别纪录 雷锋网(公众号:雷锋网) AI 科技评论按:10 月 29 日,云从科技宣布在全球最大的开源语音识别数据集 Librispeech 上,将错词率(Worderrorrate,WER)降到了 2.97%,并将 Librispeech 的 WER 指标提升了 25...

文章 2018-01-16 来自:开发者社区

Tensorflow官方语音识别入门教程 | 附Google新语音指令数据集

本文来自AI新媒体量子位(QbitAI) Google今天推出了一个语音指令数据集,其中包含30个词的65000条语音,wav格式,每条长度为一秒钟。 这30个词都是英文的,基本是yes、no、up、down、stop、go这类。 这个数据集由Google TensorFlow团队和AIY团队共同推出的,AIY就是之前推出树莓派DIY智能音箱的那个团队: 所以说,也别指望用这个数据集训练模...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐