Offline TTS

离线语音合成重磅发布

在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换成自然流畅的语音。 目前有多种音色可供选择,并提供调节语速、语调、音量等功能。适用于车载导航、智能硬件、文学有声阅读和无障碍播报等场景。
以SDK的方式集成,支持多种不同硬件平台。按照设备激活数量收费,收费更加灵活可控。 如有任何需求或疑问,请直接联系:nls_support@service.aliyun.com

智能交互

为智能车载、家居、音箱、客服和可穿戴设备等赋予一个最有温度的声音。

文学有声阅读

让富有感染力的声音给你讲故事、读小说,满足“懒人”的阅读需求。

新闻传媒播报

释放用户的双手和双眼,提供多种发音风格的新闻播报, 打造更极致的传媒体验。

订单播报

轻松在公共场所实现语音提醒,如商户收银、订单提示、排队叫号、促销信息广播等场景,让语音播报更为清晰准确、提升订单处理效率。

功能体验
场景列表
通用场景文学场景客服场景童声场景英文场景
发音人音色播放声音品质
艾佳标准女声播放精品版
艾琪温柔女声播放精品版
艾诚温暖男声播放精品版
艾达标准男声播放精品版
小云标准女声(低配硬件方案)播放标准版
小琪温柔女声(低配硬件方案)播放标准版
小达标准男声(低配硬件方案)播放标准版
小刚温暖男声(低配硬件方案)播放标准版

产品优势

效果逼真

在本地端实现了基于Knowledge-Aware Neural TTS (KAN-TTS) 语音合成技术,基于深度神经网络和机器学习,将文本转换成真实饱满、抑扬顿挫、富有表现力的语音。使得离线语音合成效果趋近于在线合成效果。

音色个性化

支持中文及英文等多种音色,多种场景及多种风格的合成声音,并可支持低数据量的离线合成声音定制。

高效稳定

接口简单易集成,运行稳定、兼容性强、首包延迟小,内存占用少,cpu占用低。对于低配硬件也有一套对应的解决方案。

节省成本

无需联网即可完成实时语音合成,按设备数授权,成本可控。

功能介绍

支持多平台

灵活控制

多种音频格式

  • 支持多平台

  • 灵活控制

  • 多种音频格式

提供iOS、Android离线语音合成SDK;

支持动态调整发音人、语速、音量、语调等;支持SSML标签语言;提供暂停、重启、取消等接口;

支持mp3、pcm音频格式;

客户案例

在2020年完成了高德地图的语音包升级,并定制了李佳琦、小团团、黄龄等明星语音包。达摩院语音实验室运用了新一代端上的KAN-TTS,大大降低了设备上运行时的耗电和合成语音的延迟,而同时,与原始录音的效果接近程度可以保持在95%以上,使用户在断网情况下依然可以在设备上体验接近云端效果的TTS。最终为高德用户提供了更高品质的导航体验。
用户在线下门店使用【导购百宝箱】来完成付款、退款等交易动作,通过使用离线语音合成技术实现收银、退款交易成功语音提示,以“唱收唱付”的方式提升客户体验。
蜂鸟即配集成最新的离线语音合成技术,将【接单提醒】、【取货地址】及【配送地址】以语音播报的方式来提醒骑手,避免骑行过程中看手机,从而尽可能避免骑士发生交通事故。更好地保障了骑手在送餐途中的安全,提升骑手配送效率。
通过语音合成技术实现文学的有声阅读,头部书籍调用长文本语音合成接口,合成更好效果的声音。长尾书籍调用离线语音合成技术,使用户无需网络流量,即可流畅倾听每本书,带动用户留存。