产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
< 智能语音交互
离线语音合成
离线语音合成是指在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换成自然流畅的语音。
离线语音合成下线维护中,请新客户暂勿购买!
立即购买
管理控制台
产品文档
产品咨询
产品优势
产品功能
更多产品与服务
文档与工具
活动与推广
产品优势
听感自然
提供语速调节、语调调节、音量调节功能。
多场景
适用于车载导航、智能硬件、文学有声阅读和无障碍播报等场景。
多平台
以SDK的方式集成,支持多种不同硬件平台。
多音色
提供标准女声、温柔男声等多风格音色,适用于文学、客服等多场景。
产品功能
离线语音合成SDK
离线语音合成是指在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换成自然流畅的语音。
提供语速调节、语调调节、音量调节功能;
适用于车载导航、智能硬件、文学有声阅读和无障碍播报等场景;
以SDK的方式集成,支持多种不同硬件平台;
按照设备激活数量收费,收费更加灵活可控;
提供多种音色选择。
立即购买
在线咨询
更多产品与服务
录音文件识别
对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。
查看详情
实时语音识别
对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。
查看详情
一句话识别
对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电、智能助手等产品中。
查看详情
语言模型自学习工具
用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制,未来会推出上传音频数据对声学模型进行定制。
查看详情
文档与工具
快速开始
从这里开始,欢迎开启智能语音交互之旅
产品介绍
快速了解智能语音交互系列产品
开发文档
了解丰富的智能语音交互 OpenAPI
相关协议
智能语音交互服务等级协议