移动研发平台 EMAS,爆款产品0元试用
一站式研发平台快速搭建移动应用,包括HTTPDNS、移动推送、移动热修复、
移动测试、移动监控等,打造移动应用全周期服务能力
爆款产品资源包

智能语音交互

智能语音交互(IntelligentSpeechInteraction),是基于语音识别、语音合成、自然语言理解等技术,为企业多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭...

智能对话分析

智能对话分析(SmartConversationAnalysis)依托于阿里云语音识别和自然语言分析技术,为企业用户提供智能的对话分析服务,支持语音和文本数据的接入。可用于电话/在线客服坐席服务质量检测、风险监控识别、服务策略优化等场景。

智能外呼机器人

智能外呼是综合利用自动语音识别(AutomaticSpeechRecognition,ASR)、文字转语音(TextToSpeech,TTS)以及自然语言理解(NaturalLanguageUnderstanding,简称NLU)技术并面向企业客户提供的一款智能客服机器人产品。智能外呼机器人可根据...

阿里云试用中心,为您提供0门槛上云实践机会!

100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!
广告

语音服务

语音通知是指通过调用语音呼叫的API,通过阿里云语音服务,从运营商网络向指定号码发起一通呼叫,呼叫被应答后,播放一段指定的音频。根据音频形式的不同,语音通知的API分为两个:1、若播放的音频为固定内容的音频文件(mp3/wav),则调用...

印刷文字识别

人工智能图像类目前包括电商图像分析服务、人脸技术识别、通用图像分析服务和文字识别技术。

接口说明

在线语音识别对时长较短(一分钟以内)的语音进行识别。适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息和语音对话等。在线语音合成语音合成服务,通过先进的深度学习技术,将文本转换成自然流畅的语音。多种音色可供您选择,...

风险识别

风险识别是一套实时分析、有效识别、全场景覆盖的业务风险管理产品。基于阿里10年大数据计算、机器学习算法、实时计算引擎的风控实战沉淀,以轻量级服务化方式,解决企业账户、营销、交易等关键业务中所遇到的欺诈问题,减少企业损失。

版本说明

新增离线语音合成产品详情开通授权模型更新增加艾飞、艾伦2个直播-视频配音声音增加知飞、知伦2个超高清场景声音增加ava美式英语声音新增无引擎更新支持英文SSML标签中的say-as标签新增SSML标记语言介绍SDK更新SDK从原本采样率只支持8K/16K...

服务升级与购买

本文以语音识别为例介绍业务开通后的相关变更操作,帮助您更灵活地使用智能语音服务。前提条件完成智能语音服务开通,详情请参见开通服务。说明语音识别服务免费试用版提供最大不超过2路并发。如需更多并发,请升级商用版,升级前请阅读...

概述

调用语音交互服务一句话识别实时语音识别语音合成录音文件识别录音文件识别极速版长文本语音合成离线语音合成设备端语音交互SDK语音识别自学习工具优化语音识别效果。语音合成定制服务定制语音合成模型各产品服务支持的功能、适用场景、...

应用发现服务

应用发现服务(ApplicationDiscoveryService)是一款面向企业上云场景,针对评估、...用于帮助待上云的企业自动发现并整理线下IT资产,分析识别主机和进程信息、资源使用水位以及各应用和组件之间的依赖关系,并向企业智能推荐相应云服务。

从这里开始

快速入门阿里云智能语音交互将为您提供如下服务:语音识别产品:语音识别产品使用介绍实时语音识别服务:对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。一句话识别服务:对一分钟内的短语音进行识别,...

应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可能力的SaaS产品,提供应用架构自动探测、故障注入式高可能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

轻量应用服务器

轻量应用服务器是面向单机应用场景的新一代计算服务,提供精品应用一键部署,支持一站式的域名、网站、安全、运维、应用管理等服务,极大优化搭建简单应用的体验,降低了入门级用户使用云计算产品的门槛。

什么是智能语音交互

智能语音交互(IntelligentSpeechInteraction)是基于语音识别、语音合成、自然语言理解等技术,为企业多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲...

应用实时监控服务ARMS

应用实时监控服务ARMS(ApplicationReal-TimeMonitoringService)是一款阿里云应用性能管理(APM)类监控产品。借助本产品,您可以基于前端、应用、业务自定义等维度,迅速便捷地为企业构建秒级响应的应用监控能力。

企业级分布式应用服务 EDAS

企业级分布式应用服务EDAS(EnterpriseDistributedApplicationService)是一个应用托管和微服务管理的PaaS平台,提供应用开发、部署、监控、运维等全栈式解决方案,支持SpringCloud、Dubbo等微服务运行环境,助力您的应用轻松上云。

应用身份服务

应用身份服务IDaaS是阿里云为企业用户提供的一套集中式身份、权限、应用管理服务,帮助您整合部署本地或云端的内部办公系统、业务系统及三方SaaS系统的所有身份,实现一个账号打通所有应用服务。

Serverless应用引擎

Serverless应用引擎(SAE)是面向应用的ServerlessPaaS平台,帮助PaaS层用户免运维IaaS、按量计费、低门槛微服务上云,将Serverless架构和微服务架构的完美结合。

Web应用托管服务

Web+是一款用来运行并管理Web类、移动类和API类应用程序的PaaS产品。无需管理底层基础设施的情况下,即可简单、高效、安全而又灵活的对应用进行部署、伸缩、调整和监控。

控制台功能概述

您可以管控台新建应用、配置应用相关的语音识别模型、语音合成发音人,或者自学习平台下定制适合您业务领域的热词或语言模型来提高识别准确率。登录管理控制台使用阿里云主账号,登录智能语音交互管理控制台。默认进入总览。生成...

应用配置管理 ACM

应用配置管理(ApplicationConfigurationManagement,简称ACM),是一款分布式架构环境中对应用配置进行集中管理和推送的工具类产品。基于该产品,您可以微服务、DevOps、大数据等场景下极大地减轻配置管理的工作量,增强配置管理的...

Web 应用防火墙

阿里云Web应用防火墙基于云安全大数据能力,有效防御各类OWASP常见Web攻击并过滤海量恶意CC攻击,避免您的网站资产数据泄露,保障网站业务安全性与可用性。

功能特性

PCM、WAV、MP3iOS/Android联系售前可申请3个设备授权可单独购买设备端语音交互SDK实时远场信号处理、语音唤醒、人声检测、在线语音识别以及在线语音合成。智能音箱、儿童教育故事机、语音IoT家电等需要远近场语音交互的智能硬件设备端。PCM...

服务使用问题

如果所有情况下语音识别都不准确,或者识别率很低,往往需要整体考虑是否有什么地方配置错误,例如实际语音的采样率(在线识别场景ASR只支持8k16bit或者16k16bit)、调用时设置的采样率参数(8000或者16000)、ASR服务端模型(8k或者16k)...

语音识别自学习工具

在语音识别服务中心,如果您的业务领域有部分词汇默认识别效果不好可以使用热词功能;如果您需要的语音识别服务场景不所提供的模型范围内,或者需要对标准模型进行更进一步优化,可以使用语音模型定制功能,达成优化目的。通过自学习工具...

管理项目

语音识别单击语音识别ASR模块下的修改配置。您可以从场景列表中选择基础模型或添加自学习模型。自学习模型的使用方法,请参见管理定制模型。单击语音识别ASR模块下的创建热词,配置项目热词,详情请参见管理热词。语音合成语音合成TTS...

内容安全

内容安全是一款多媒体内容智能识别服务,支持对图片、视频、文本、语音等对象进行多样化场景检测,有效帮助您降低内容违规风险。

Android SDK(旧版)

SpeechTranscriberWithRecorder:代表一次实时语音识别请求,SpeechTranscriber的基础上内置录音功能,调用更简便。SpeechTranscriberCallback:语音识别回调接口,获得识别结果、发生错误等事件发生时会触发回调。您可参照demo回调...

数据库和应用迁移服务 ADAM

随着互联网的兴起,互联网的技术架构相比传统的IT架构来说可扩展性和性价比方面的优势越来越明显,许多传统企业希望把他们的IT系统朝着互联网架构进行改造,阿里云正是一个为企业用户提供互联网架构的平台。而AdvancedDatabase&...

管理定制模型

如果您需要的语音识别服务场景不所提供的模型范围内,或者需要对标准模型进行更进一步优化,可以通过自学习平台,达成优化目的。通过使用阿里云语音自学习工具,您可以操作界面上传训练语料文本,并选择对应领域的语言基础模型,对训练...

图像搜索

图像搜索服务(ImageSearch)是以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的和以文搜图的智能...图像搜索服务基于图像识别技术基础上,结合不同行业应用和业务场景,帮助用户实现相同或相似图片搜索。

工业大脑开放平台

工业大脑是基于阿里云大数据的一体化计算平台,通过数据工厂对企业系统数据、工厂设备数据、传感器数据、人员管理数据等多方工业企业数据进行汇集,借助语音交互、图像/视频识别、机器学习和人工智能算法,激活海量数据价值,为解决工业...

计费概述

语音数据处理费用服务计费方式说明实时语音识别按照处理的语音时长计费可以自助开通后付费或购买预付费资源包。一句话语音识别按照调用次数计费可以自助开通后付费或购买预付费资源包。录音文件识别按照录音时长计费可以自助开通后付费或...

Android SDK(旧版)

SDK关键接口NlsClient:语音处理客户端,利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全,建议全局仅创建一个实例。SpeechRecognizer:代表一次语音识别请求。需要将录制的音频或从文件读取的...

智能视觉

使用智能视觉可以让零算法基础的开发者和企业快速享受到AI视觉计算能力带来的便利,智能视觉面向存储在线上环境的图片、视频文件提供包括图像分类、物体检测、事件检测、物体识别等能力,可应用于家庭监控、明厨亮灶、智慧工地等各种场景。

智能媒体管理

阿里云智能媒体管理(IntelligentMediaManagement,简称IMM),是阿里云提供的针对媒体数据的高级、智能管理服务。...IMM提供场景化构建的一站式数据应用解决方案,适合媒资管理、智能网盘、社交应用、图库图床等开发者使用。

SDK及接口调用问题

为什么语音识别准确率很低,有时只识别出几个字?请检查音频数据的采样率与管控台应用的模型是否一致,以及音频是否是单通道录音。说明只有录音文件识别支持双通道的录音。确认调用方式和采样率都没问题,识别还是不准确怎么办?您可以通过...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
产品推荐
Web应用防火墙 智能语音交互 人脸识别Face Recognition 云服务器 商标 对象存储 SSL证书 短信服务 全站加速 DCDN
这些文档可能帮助您
RESTful API 安骑士常见问题概览 RESTFUL API 选择购买方式 SSML标记语言介绍 接入流程概述

新品推荐

你可能感兴趣

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折
移动研发平台 EMAS,爆款产品0元试用
一站式研发平台快速搭建移动应用,包括HTTPDNS、移动推送、移动热修复、
移动测试、移动监控等,打造移动应用全周期服务能力
爆款产品资源包