离线语音合成
离线语音合成是指在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换成自然流畅的语音。
活动与推广

产品优势

听感自然
提供语速调节、语调调节、音量调节功能。
多场景
适用于车载导航、智能硬件、文学有声阅读和无障碍播报等场景。
多平台
以SDK的方式集成,支持多种不同硬件平台。
多音色
提供标准女声、温柔男声等多风格音色,适用于文学、客服等多场景。

产品功能

离线语音合成SDK
离线语音合成是指在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换成自然流畅的语音。
  • 提供语速调节、语调调节、音量调节功能;
  • 适用于车载导航、智能硬件、文学有声阅读和无障碍播报等场景;
  • 以SDK的方式集成,支持多种不同硬件平台;
  • 按照设备激活数量收费,收费更加灵活可控;
  • 提供多种音色选择。

更多产品与服务

录音文件识别
对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。
实时语音识别
对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。
一句话识别
对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电、智能助手等产品中。
语言模型自学习工具
用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制,未来会推出上传音频数据对声学模型进行定制。

文档与工具