文章 2025-02-19 来自:开发者社区

Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 ️ “智能家居集体「觉醒」!开源语音模型听懂你的川普怒吼,方言骂人都能温柔回应” 大家好,我是蚝油菜花。你是否经...

Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
文章 2025-02-10 来自:开发者社区

FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! 微信公众号|搜一搜:蚝油菜花 大家好,我是蚝油菜花,今天跟大家分享一下 FireRedASR 这个小红书开源的工业级自动语音识别模型。 快速阅读 FireRedASR 是小红书开源的工业级自动语音识别模型,支持普通话、中文方...

FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
文章 2025-02-02 来自:开发者社区

SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 概述:SpeechGPT 2.0 是复旦大学 OpenMOSS 团队推出的端到端实时语音交互模型,基于百万小时级中文语音数据训练,支持情感控制和低延迟响应。 ...

SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
文章 2024-10-29 来自:开发者社区

语音识别模型

简介 Whisper 是 OpenAI 的一项语音处理项目,旨在实现语音的识别、翻译和生成任务。作为基于深度学习的语音识别模型,Whisper 具有高度的智能化和准确性,能够有效地转换语音输入为文本,并在多种语言之间进行翻译。通过不断的优化和更新,Whisper 致力于提供更加优质和高效的语音处理解决方案,以满足...

语音识别模型
问答 2024-08-21 来自:开发者社区

在modelscope-funasr用的paraformer的一个语音识别模型,怎么加上热词?

在modelscope-funasr用的paraformer的一个语音识别模型,我想加上热词,可以怎么加呢?

问答 2024-08-21 来自:开发者社区

modelscope-funasr的多说话人语音识别模型 支持实时听写吗?

modelscope-funasr的多说话人语音识别模型 支持实时听写吗?

问答 2024-08-14 来自:开发者社区

阿里云语音AI智能语音交互中录音文件识别的customization_id定制模型还是不能区分热词。

阿里云语音AI智能语音交互中录音文件识别的customization_id定制模型还是不能区分热词。这是什么原因呀

问答 2024-08-06 来自:开发者社区

为什么自学习平台训练语音识别模型只需要提供文本不需要音频?

为什么自学习平台训练语音识别模型只需要提供文本不需要音频?

问答 2024-07-25 来自:开发者社区

阿里云的语音识别服务提供了多个模型以适应不同的应用场景主要包括哪些?

阿里云的语音识别服务提供了多个模型以适应不同的应用场景主要包括哪些?

问答 2024-07-23 来自:开发者社区

阿里云语音AI智能语音交互下面的cosyvoice大模型可以免费试用吗?

阿里云语音AI智能语音交互下面的cosyvoice大模型可以免费试用吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等