智能语音交互

智能语音交互(IntelligentSpeechInteraction),是基于语音识别、语音合成、自然语言理解等技术,为企业多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭...

智能对话分析

智能对话分析(SmartConversationAnalysis)依托于阿里云语音识别和自然语言分析技术,为企业用户提供智能的对话分析服务,支持语音和文本数据的接入。可用于电话/在线客服坐席服务质量检测、风险监控识别、服务策略优化等场景。

智能外呼机器人

智能外呼是综合利用自动语音识别(AutomaticSpeechRecognition,ASR)、文字转语音(TextToSpeech,TTS)以及自然语言理解(NaturalLanguageUnderstanding,简称NLU)技术并面向企业客户提供的一款智能客服机器人产品。智能外呼机器人可根据...

阿里云试用中心,为您提供0门槛上云实践机会!

100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!
广告

语音服务

语音通知是指通过调用语音呼叫的API,通过阿里云语音服务,从运营商网络向指定号码发起一通呼叫,呼叫被应答后,播放一段指定的音频。根据音频形式的不同,语音通知的API分为两个:1、若播放的音频为固定内容的音频文件(mp3/wav),则调用...

接口说明

在线语音识别对时长较短(一分钟以内)的语音进行识别。适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息和语音对话等。在线语音合成语音合成服务,通过先进的深度学习技术,将文本转换成自然流畅的语音。多种音色可供您选择,...

印刷文字识别

人工智能图像类目前包括电商图像分析服务、人脸技术识别、通用图像分析服务和文字识别技术。

风险识别

风险识别是一套实时分析、有效识别、全场景覆盖的业务风险管理产品。基于阿里10年大数据计算、机器学习算法、实时计算引擎的风控实战沉淀,以轻量级服务化方式,解决企业账户、营销、交易等关键业务中所遇到的欺诈问题,减少企业损失。

版本说明

新增离线语音合成产品详情开通授权模型更新增加艾飞、艾伦2个直播-视频配音声音增加知飞、知伦2个超高清场景声音增加ava美式英语声音新增无引擎更新支持英文SSML标签中的say-as标签新增SSML标记语言介绍SDK更新SDK从原本采样率只支持8K/16K...

服务升级与购买

本文以语音识别为例介绍业务开通后的相关变更操作,帮助您更灵活地使用智能语音服务。前提条件完成智能语音服务开通,详情请参见开通服务。说明语音识别服务免费试用版提供最大不超过2路并发。如需更多并发,请升级商用版,升级前请阅读...

使用前须知

PCM、WAV、MP3iOS/Android联系售前可申请3个设备授权可单独购买设备端语音交互SDK实时远场信号处理、语音唤醒、人声检测、在线语音识别以及在线语音合成。智能音箱、儿童教育故事机、语音IoT家电等需要远近场语音交互的智能硬件设备端。PCM...

从这里开始

快速入门阿里云智能语音交互将为您提供如下服务:语音识别产品:语音识别产品使用介绍实时语音识别服务:对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。一句话识别服务:对一分钟内的短语音进行识别,...

服务使用问题

如果所有情况下语音识别都不准确,或者识别率很低,往往需要整体考虑是否有什么地方配置错误,例如实际语音的采样率(在线识别场景ASR只支持8k16bit或者16k16bit)、调用时设置的采样率参数(8000或者16000)、ASR服务端模型(8k或者16k)...

功能特性

PCM、WAV、MP3iOS/Android联系售前可申请3个设备授权可单独购买设备端语音交互SDK实时远场信号处理、语音唤醒、人声检测、在线语音识别以及在线语音合成。智能音箱、儿童教育故事机、语音IoT家电等需要远近场语音交互的智能硬件设备端。PCM...

Android SDK(旧版)

SpeechTranscriberWithRecorder:代表一次实时语音识别请求,SpeechTranscriber的基础上内置录音功能,调用更简便。SpeechTranscriberCallback:语音识别回调接口,获得识别结果、发生错误等事件发生时会触发回调。您可参照demo回调...

计费概述

语音数据处理费用服务计费方式说明实时语音识别按照处理的语音时长计费可以自助开通后付费或购买预付费资源包。一句话语音识别按照调用次数计费可以自助开通后付费或购买预付费资源包。录音文件识别按照录音时长计费可以自助开通后付费或...

Android SDK(旧版)

SDK关键接口NlsClient:语音处理客户端,利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全,建议全局仅创建一个实例。SpeechRecognizer:代表一次语音识别请求。需要将录制的音频或从文件读取的...

内容安全

内容安全是一款多媒体内容智能识别服务,支持对图片、视频、文本、语音等对象进行多样化场景检测,有效帮助您降低内容违规风险。

什么是智能语音交互

智能语音交互(IntelligentSpeechInteraction)是基于语音识别、语音合成、自然语言理解等技术,为企业多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲...

语音识别自学习工具

在语音识别服务中心,如果您的业务领域有部分词汇默认识别效果不好可以使用热词功能;如果您需要的语音识别服务场景不所提供的模型范围内,或者需要对标准模型进行更进一步优化,可以使用语音模型定制功能,达成优化目的。通过自学习工具...

工业大脑开放平台

工业大脑是基于阿里云大数据的一体化计算平台,通过数据工厂对企业系统数据、工厂设备数据、传感器数据、人员管理数据等多方工业企业数据进行汇集,借助语音交互、图像/视频识别、机器学习和人工智能算法,激活海量数据价值,为解决工业...

管理项目

语音识别单击语音识别ASR模块下的修改配置。您可以从场景列表中选择基础模型或添加自学习模型。自学习模型的使用方法,请参见管理定制模型。单击语音识别ASR模块下的创建热词,配置项目热词,详情请参见管理热词。语音合成语音合成TTS...

控制台功能概述

您可以管控台新建应用、配置应用相关的语音识别模型、语音合成发音人,或者自学习平台下定制适合您业务领域的热词或语言模型来提高识别准确率。登录管理控制台使用阿里云主账号,登录智能语音交互管理控制台。默认进入总览。生成...

语音识别问题排查

概述本文主要为您介绍语音识别中出现问题的排查步骤及解决方案。详细信息阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与数据...

管理定制模型

如果您需要的语音识别服务场景不所提供的模型范围内,或者需要对标准模型进行更进一步优化,可以通过自学习平台,达成优化目的。通过使用阿里云语音自学习工具,您可以操作界面上传训练语料文本,并选择对应领域的语言基础模型,对训练...

基本概念

中间结果(intermediateresult)调用语音识别服务时可以设置是否返回中间结果:设置为false时,只语音全部识别完后返回一次完整的结果。设置为true时,除了最后一次完整的结果之外,还会您说话的同时返回中间结果。如一段语音识别...

SDK及接口调用问题

为什么语音识别准确率很低,有时只识别出几个字?请检查音频数据的采样率与管控台应用的模型是否一致,以及音频是否是单通道录音。说明只有录音文件识别支持双通道的录音。确认调用方式和采样率都没问题,识别还是不准确怎么办?您可以通过...

云客服

云客服依托大数据平台,凭借数据挖掘,搜索,语音转文本,自然语音处理,机器学习等前沿技术,打造一套完整的智能服务体系。最终达到:\n\n以智能自助服务逐渐取代大部分人工服务;\n以智能引导和智能决策、机器人辅助人工服务;\n让客户...
来自: 首页 >云客服

图像搜索

图像搜索服务(ImageSearch)是以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的和以文搜图的智能...图像搜索服务基于图像识别技术基础上,结合不同行业应用和业务场景,帮助用户实现相同或相似图片搜索。

iOS SDK

brief设置语音识别结束回调函数*@note在语音识别完成时,触发该回调*@paramevent回调方法*@paramstatusCode状态码*@paramresult识别最终结果*@paramerrorMessage错误消息*@returnvoid*/-(void)OnRecognizedCompleted:(NlsDelegateEvent)...

常见问题

概述本文主要列举使用智能语音交互产品时遇到的常见问题。详细信息常见问题如下:语音识别问题排查SDK调用问题服务使用问题服务开通问题NUISDK调用问题适用于智能语音交互
来自: 首页

产品优势

语音识别识别准确率高基于SAN-M自研的“识音石”通用端到端语音识别框架,中文识别准确率可达业内最高水平;输入法、客服、会议等领域,识别字错误率相比上一代系统下降10%~30%,大幅提高了语音识别的精度。识别速度快采用“字”级别...

什么是智能语音导航

智能语音导航是综合利用自动语音识别(AutomaticSpeechRecognition,ASR)、文字转语音(TextToSpeech,TTS)以及自然语言理解(NaturalLanguageUnderstanding,简称NLU)技术并面向企业客户提供的一款电话机器人产品。智能语音导航传统的...

智能视觉

使用智能视觉可以让零算法基础的开发者和企业快速享受到AI视觉计算能力带来的便利,智能视觉面向存储在线上环境的图片、视频文件提供包括图像分类、物体检测、事件检测、物体识别等能力,可应用于家庭监控、明厨亮灶、智慧工地等各种场景。

相册与网盘服务

相册与网盘服务(PhotoandDriveService)是为开发者提供的面向企业与个人数据管理,内容识别与协作的开放平台。

IoT安全运营中心

物联网安全运营中心-LinkSOC(SecurityOperationsCenter),帮助管理员识别和消除IoT系统潜在的安全风险,保障IoT系统运行过程中的安全性。

媒体处理

媒体处理...它以经济、弹性和高可扩展的视频转换方法,将多媒体数据转码成适合全平台播放的格式。并基于海量数据深度学习,对视频的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。

智能联络中心

智能联络中心(ArtificialIntelligenceContactSystem),是阿里云整合人工智能能力和语音通信能力为企业打造的一套高效联络中心系统,助力企业快捷高效的联络用户。我们提供标准的Saas服务并开放丰富的接口方便企业调用和集成。注:服务...

金融级实人认证

实人认证是依托真人检测和人脸比对等生物识别技术等进行的自然人身份的核验服务,用于确认当前业务操作是由指定用户本人完成的。
< 1 2 3 4 ... 161 >
共有161页 跳转至: GO
产品推荐
智能语音交互 语音服务 人脸识别Face Recognition 云服务器 商标 SSL证书 对象存储 全站加速 DCDN 共享流量包
这些文档可能帮助您
RESTFUL API 图像识别介绍 获取Token 选择购买方式 人脸人体介绍 接入流程概述

新品推荐

你可能感兴趣

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折