语音分析
语音分析技术是指通过检测与分析音频,识别特定语音分类的技术,包括说话人识别、语种识别、性别识别、声音事件检测等技术,可应用于会议音频识别、客服音频分析或音视频剪辑等场景。

产品规格

应用场景

语种识别
性别识别
声音事件检测
说话人识别
语种识别
实现对上传音频(实时或离线)中所说的是哪种语言进行句级别的判定,并返回是中、英、粤语或其他语言。
能够解决
智能外呼场景
电话客服营销场景下基于语种信息智能切换相对识别更佳语音模型。
跨国会议场景
由于跨国会议往往涉及到多个国家人群的对话,基于用户上传的声音进行分析可以自动选择不同识别模型提升会议识别率。
语音指令场景
跨国出海app面对不同使用人群可自由根据终端用户切换识别模型,保证指令有效性。
相关产品
了解更多 >
性别识别
通过对上传音频(实时或离线)进行高效解析,有效判定说话人的性别(男女)以及年龄段(儿童、成年、老人)。
能够解决
外呼营销场景
通过对一句话内有效音频识别出用户性别,以便更好地提供人性化语音交互服务,提升客户体验。
用户洞察
针对用户声音分析,将用户进行性别属性分类。
用户推荐
使用性别识别来明确用户属性再加以分配不同的标签分类,个性化推送不同内容。
相关产品
了解更多 >
声音事件检测
通过一段声音来对环境音(包括语音、短视频等)里面的事件类型进行检测分类,其主要任务是检测识别音频中诸如背景音乐、哭声、笑声、爆炸声之类的声音,并标注出声音的起止时间。
能够解决
音视频剪辑
视频后期工作者往往要面对海量的剪辑工作,通过此功能可轻松定位不同事件位置,极大提升了剪辑效率。
家庭安全监护
针对一些家用陪伴机器人,可以针对声音分析来判断是否有婴幼儿哭声、烟雾报警器声、流水声等不安全因素,以此进行报警提醒。
相关产品
了解更多 >
说话人识别
基于自研声纹识别算法,通过解析一段语音,将提取到的音频特征与之前注册的音频特征进行比对,来对说话人身份进行核验(类似人脸识别)。
能够解决
金融风控场景
说话人识别从1:1身份确认到1:N身份辨认,为金融定制精准高效的客户身份安全验证。
远程核验场景
用户核验可以通过多种验证方式来对目标人现场进行身份核验,确定来电人员身份信息,帮助相关人员有效核验对方身份。
企业管理场景
使用该功能结合其他生物识别进行考勤,成本较低,能有效防止代打卡现象。特别适合大规模流动性较高的群体的考勤场景。
相关产品
了解更多 >

产品优势

易接入
支持HTTP&SDK多种技术接入,各类平台适用,支持本地化部署
速度快
可批量对音频进行识别并快速返回结果
领域广
可应用于多种场景如电话客服、手机应用等

产品动态

2016-12-15 新功能/规格
【智能语音交互】英文语音识别
查看详情
2016-12-23 功能优化
【智能语音交互】提供C++ SDK
查看详情
2016-12-30 新功能/规格
【智能语音交互】语音识别支持用户自定义热词
查看详情
2016-12-30 功能优化
【智能语音交互】语音识别JAVA SDK提供压缩传输功能
查看详情
2017-01-20 新功能/规格
智能对话平台1.0
查看详情
2017-03-01 新功能/规格
支持自动对录音进行人声分离
查看详情
2017-03-01 新功能/规格
智能对话平台邀请内测版本发布
查看详情
2017-04-01 新功能/规格
支持东北话、河南话、四川话的语音识别
查看详情
2017-04-20 新功能/规格
语音识别支持粤语的识别
查看详情
2017-06-06 新功能/规格
【语音识别】语言模型自定制
查看详情
2017-07-21 新功能/规格
语音识别的C++ SDK同时能支持长语音和短语音的识别
查看详情
2017-08-14 新功能/规格
语音关键字识别-更低成本的语音关键字检出
查看详情
2017-08-14 功能优化
语音识别-8K电话录音-机器自动分轨效果优化
查看详情
2018-11-30 新功能/规格
【公有云】甜美客服TTS模型更新
查看详情
2018-12-27 新功能/规格
【TTS】Neural TTS 上线
查看详情
2019-01-25 功能优化
公有云自学习模型提供语言模型免费试用版
查看详情
2019-03-19 新功能/规格
智能语音交互产品使用用量监控功能发布
查看详情
2019-03-19 新功能/规格
智能语音交互产品新增子账户权限访问控制
查看详情
2019-04-18 功能优化
公共云支持英文定制语言模型
查看详情
2019-04-18 功能优化
公共云支持英文泛热词
查看详情
2019-04-18 功能优化
公共云粤语客服模型支持定制语言模型
查看详情
2019-04-18 功能优化
公共云方言客服模型支持定制语言模型
查看详情
2019-05-09 功能优化
公共云报表多样化,支持按照appkey维度展示
查看详情
2019-05-27 功能优化
【TTS】官网增加“预览版”TTS声音体验
查看详情
2019-06-06 功能优化
语音合成官网客服发音人默认文本更新
查看详情
2019-06-11 价格调整
公共云语音合成调用计费逻辑调整
查看详情
2019-06-27 价格调整
公共云新预付费资源包上线
查看详情
2019-08-27 功能优化
【TTS】新增4个英文精品声音
查看详情
2019-08-27 功能优化
【TTS】儿童音艾彤和艾薇模型上线
查看详情
2019-08-27 功能优化
【TTS】艾夏声音更新发布
查看详情
2019-08-27 功能优化
【TTS】语音合成自建催收声音艾雅上线
查看详情
2019-09-19 功能优化
【TTS】定制声音页面增加第一财经-阳子样音和第一财经logo
查看详情
2019-09-19 功能优化
【TTS】定制声音页面增加宝拉样音和凯叔logo
查看详情
2019-09-19 功能优化
文件转写支持多后处理集群路由
查看详情
2019-10-21 功能优化
公共云首页改版
查看详情
2019-10-23 功能优化
【TTS】艾娜模型首发
查看详情
2019-10-28 功能优化
c++ sdk的token获取机制改造
查看详情
2019-10-28 功能优化
java sdk 的AccssToken改造
查看详情
2019-10-31 功能优化
【公有云官网】支持录音文件识别体验模块
查看详情
2019-11-08 功能优化
公共云在创建app之前就展示原子能力
查看详情
2019-11-28 功能优化
【TTS】服务端和SDK支持设置MP3码率接口
查看详情
2019-12-12 功能优化
长文本预付费资源包上线
查看详情
2019-12-30 功能优化
公共云艾美,艾彤模型优化
查看详情
2020-01-18 新功能/规格
智能语音交互-本地部署v2.6.7版本发布
查看详情
2020-03-01 价格调整
公共云试用版免费策略调整
查看详情
2020-04-02 新功能/规格
公共云实时转写语音识别服务支持高级vad参数功能,可进一步满足用不同场景下的定制化vad需求
查看详情
2020-05-11 新功能/规格
语音合成产品新增多种方言声音
查看详情
2020-05-15 新功能/规格
ASR语音识别产品新增日语和西班牙语识别模型
查看详情
2020-06-04 新功能/规格
智能语音交互产品,语音识别新增非电话场景的粤语识别模型
查看详情
2020-06-18 新功能/规格
阿里云智能语音交互国际站商业化发布
查看详情
2020-06-28 新功能/规格
语音识别产品新增四川话模型(电话场景)
查看详情
2020-09-10 新功能/规格
智能语音交互新一代“端到端”语音识别模型上线
查看详情
2020-09-15 新功能/规格
语音识别产品新增韩语、印尼语、越南语、阿拉伯语和哈萨克语等多个语种的语音识别模型
查看详情
2021-11-01 新功能/规格
阿里云-智能语音交互-听悟(商业化) 发布
查看详情
2022-03-21 新地域/新可用区
华北2(北京)、华南1(深圳)正式开服
查看详情
2022-04-10 功能优化
录音文件识别体验升级
查看详情
2022-05-16 新功能/规格
语音分析系列(说话人识别、声音事件检测、性别识别、语种识别)相关服务重磅发布
查看详情
查看全部日志

文档与工具