自然语言处理

自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,已经在客服、资讯、金融、司法、医疗等场景有广泛的应用。

语音服务

根据音频形式的不同,语音通知的API分为两个:1、若播放的音频为固定内容的音频文件(mp3/wav),则调用singleCallByVoice语音文件外呼接2、若播放的音频为带有变量的文本模板,每次调用时根据变量替换值从文本模板转化为音频文件,则调用...

智能语音交互

Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈...

阿里云试用中心,为您提供0门槛上云实践机会!

100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!
广告

机器翻译

依托领先的自然语言处理技术和海量的互联网数据优势,阿里巴巴成功上线基于注意力机制的深层神经网络翻译系统(NMT),帮助用户跨越语言鸿沟,畅享交流和获取信息,实现无障碍沟通。凭借海量数据积累及关键技术创新,在电商领域翻译质量独...

图数据库 GDB

图数据库 GDB 是一种支持 Property Graph 图模型,用于处理高度连接数据查询与存储的实时,可靠的在线数据库服务。GDB 支持 TinkerPop Gremlin 查询语言,可以帮助用户快速构建基于高度连接的数据集的应用程序。

智能对话分析

智能对话分析(Smart Conversation Analysis) 依托于阿里云语音识别和自然语言分析技术,为企业用户提供智能的对话分析服务,支持语音和文本数据的接入。可用于电话/在线客服坐席服务质量检测、风险监控识别、服务策略优化等场景。

智能外呼机器人

智能外呼是综合利用自动语音识别(Automatic Speech Recognition,ASR)、文字转...Speech,TTS)以及自然语言理解(Natural Language Understanding,简称NLU)技术并面向企业客户提供的一款智能客服机器人产品。智能外呼机器人可根据业务场

智能云相册

智能云相册(Cloud Photos)是阿里云为影像类应用提供的一站式解决方案。智能云相册除了提供影像文件存储、管理等基础功能以外,还支持对影像内容进行分类打标、面孔识别等智能分析,并提供基于自然语言理解的智能搜索服务。

智能数据助理

智能数据助理(DataBot)是一款通过自然语言对话形式提供智能分析的数据机器人,具备对话式数据查询、增强式分析、智能洞察、简报定制推送、智能预警等能力。用户可以随时随地向智能数据助理提问,进行个性化的数据查询和数据分析。无需...

智能对话机器人

Robot)是一款基于自然语言处理(NLP)和人工智能(AI)技术,面向开发者提供智能会话能力的云服务。开发者可以使用云小蜜创建会话机器人,为机器人配置知识库以实现智能问答,使用对话工厂配置意图实现多轮对话与自助服务(如订单查询、...

可信计算服务

可信计算服务 C3S(Blockchain Confidential Computing Service)为链上应用提供链上链下数据交叉核验,保证链上流转数据可信扩展,并提供通用的、隐私保护的数据分析能力,支持多方业务数据融合和治理,适用于金融风控、数字物流等场景。

从这里开始

长文本语音合成服务:将超长文本(十万字)合成为接近真人的语音服务,包含男女童音、多语言/方言(且拥有音频重复使用权)。适用于文学伴读、新闻阅读等场景。离线语音合成:在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换...

模板工厂

TemplateId:IceSys_VideoMuteClipParams:{"VideoArray":["*2788e810116a45109f2e*","*67f44f4964e6c998dee8*"]}(注:VideoArray中的元素为视频素材的MediaId)合成结果音频拼接将多个音频拼接一个音频TemplateId:IceSys_...

概述

媒体合成API用法通过时间线合成直接指定时间线,即Timeline数据,调用ProduceEditingProjectVideo接口,绝大多数场景下,使用这种方式即可,见下图:通过云剪辑工程合成通过云剪辑工程Id进行媒体合成的方式,适用于对云剪辑工程进行深入...

C++ SDK(新)

设置音频合成结束回调函数request->setOnChannelClosed(OnSynthesisChannelClosed,cbParam);设置音频合成通道关闭回调函数request->setOnTaskFailed(OnSynthesisTaskFailed,cbParam);设置异常失败回调函数request->setOnBinaryDataReceived...

SDK及接口调用问题

开通自学习模型训练,通过模型定制的方式提高大量文本的识别率,详情请参见语言模型定制概述。音频数据必须连续发送吗?音频数据必须连续发送。服务端在超过一定时间未接到语音数据(10秒)会超时断开连接,返回40000004错误信息。如果需要...

C++ SDK(新)

设置音频合成结束回调函数request->setOnChannelClosed(OnSynthesisChannelClosed,cbParam);设置音频合成通道关闭回调函数request->setOnTaskFailed(OnSynthesisTaskFailed,cbParam);设置异常失败回调函数request->setOnBinaryDataReceived...

版本说明

新增长文本语音合成新增合成声音新增发音人:粤语女声佳佳、粤语女声桃子、日语男声智也、日语男声智香、美式英语Annie、印尼女声Indah。文学场景资讯声音:艾笑、艾树、艾茹、艾倩。直播场景:柜姐、Stella等。新增语音合成提升个性化...

使用前须知

需要人工合成音的场景。PCM、WAV、MP3Java/C++/Android/iOS最大2个并发可单独购买录音文件识别非实时录音文件上传后(文件大小不超过512 MB),针对免费用户,可在24小时内完成识别并返回识别文本;针对付费用户,可在6小时内完成识别并...

产品优势

听感自然经海量音频数据训练,使合成音真实饱满、抑扬顿挫、富有表现力,MOS评分达到业内顶级水准。深度定制根据用户需求定制库,满足用户的个性化应用需求,提供标准男女声、温柔甜美女声等多风格选择,支持标记语言(SSML)方式的合成...

功能特性

需要人工合成音的场景。PCM、WAV、MP3Java/C++/Android/iOS最大2个并发可单独购买录音文件识别非实时录音文件上传后(文件大小不超过512 MB),针对免费用户,可在24小时内完成识别并返回识别文本;针对付费用户,可在6小时内完成识别并...

音频处理

本文为您介绍整体静音、指定区间静音、提取音频、视频静音+完整音频混音、视频静音+音频指定区间混音、视频调节音量+音频调节音量、音频拼接、多轨音频混音、综合配音的示例,以音频处理场景Timeline的各种数据组织举例。简介视频剪辑的...

Android SDK(旧版)

SpeechSynthesizerCallback:语音合成回调接口,在获得合成音频数据、发生错误等事件发生时会触发回调。您需要实现此接口,在回调方法中加入自己的处理逻辑。调用顺序创建NlsClient实例。定义SpeechSynthesizerCallback实现类,按业务需求...

接口说明

在线语音合成语音合成服务,通过先进的深度学习技术,将文本转换自然流畅的语音。多种音色可供您选择,并提供调节语速、语调和音量等功能。NUI SDK与其他原子SDK区别对比项语音识别SDK(含一句话识别、实时语音识别和录音文件识别)语音...

应用场景

无障碍播报将文字转流畅动听的自然语言声音,实现面向各类人群的无障碍播报。内容创作自媒体、大V等内容创作方可将个性化定制的声音应用于传播平台。如,资讯播报、视频配音等。在线教育“复制”在线课堂老师的声音,增强课堂的交互性。...

SSML标记语言介绍

合成时长超出背景时长时,背景将随合成音频循环播放(如果背景不是WAV格式,可使用ffmpeg将其转为WAV格式:ffmpeg-i 输入音频 acodec pcm_s16le-ac 1-ar 16000 目标.wav)。标签内的URL如果包含XML的特殊字符,需要做字符转义。常用...

标记语言介绍

合成时长超出背景时长时,背景将随合成音频循环播放(如果背景不是WAV格式,可使用ffmpeg将其转为WAV格式:ffmpeg-i 输入音频 acodec pcm_s16le-ac 1-ar 16000 目标.wav)。标签内的URL如果包含XML的特殊字符,需要做字符转义。常用...

语音智能处理类模型

Recognition)是人工智能、语言学及声学等学科融合发展的重要技术,即给定人类语言音频输入,ASR技术自动将音频转写为文本。在语音识别的基础上,语音理解(Speech Understanding)可以采用人工智能技术分析音频特征,对输入的语音进行...

什么是智能语音导航

使用海量的音频数据训练合成数据,合成音真实饱满、抑扬顿挫、富有表现力,MOS评分达到业内顶级水准。典型场景 智能业务办理- 当客户拨打热线电话时,可以预设好的业务流程模板,让客户以语音交互的方式自助办理业务(如预订酒店,查订单,...

视频合成

调用ProduceEditingProjectVideo将一个或多个视频合成为成品。可以通过时间线参数直接提交源视频,也可以先创建云剪辑工程,再提交合成。说明 该接口返回合成任务的提交结果,不保证接口返回时视频已合成完毕。合成任务将进入后台排队,...

视频合并

指定参考音轨/*指定以某个轨道的音频作为最终合成视频的音频@param referenceTrack 轨道*/- (void)setOutputAudioReferenceTrack:(AliyunMixTrack*)referenceTrack;添加视频流AliyunMixStream对象解析如下所示。视频文件路径*/property...

什么是智能语音交互

Interaction)是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融...

语音合成时间戳功能介绍

语音实时合成服务在输出音频流的同时,可输出每个汉字/英文单词在音频中的时间位置,即时间戳,时间戳功能又叫字级别音素边界接口。该时间信息可用于驱动虚拟人口型、做视频配音字幕等。注意 只有支持字级别音素边界接口的发音人才有此功能...

SDK更新记录

版本号 更新描述 发布时间 相关文档 生活物联网平台SDK C语言 1.6.0 支持全球统一激活中心 设备端重连策略优化 蓝牙辅助配网时长优化 蓝牙辅助配网的离线配网和控制 设备本地时钟同步服务 2020-06-18 获取SDKSDK新增功能介绍 LinkVisual...

接口说明

语音合成提供将输入文本合成为语音二进制数据的功能。功能简介NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求,NUI SDK既能够提供全链路的语音能力,同时可做原子能力SDK进行使用,并保持接口的统一。语音合成功能支持...

语音列表

cloudcall-test</FilePath><Type>TTS</Type><Description>测试音频</Description><Instance>b0eb2742-f37e-4c67-82d4-25c651c1c450</Instance><Content>云呼TTS测试</Content><FileName>测试音频</FileName><OssFileName>001.wav...

接口说明

离线语音合成是指在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换自然流畅的语音。产品体验更多合成效果可至离线语音合成产品详情页进行体验。功能介绍离线合成暂不支持多实例调用,主要功能包括:提供语速调节、语调调节、...

概述

本实践案例介绍使用物联网平台提供的C语言设备端SDK,将搭载实时操作系统(RTOS)的微控制单元(MCU)的设备接入阿里云物联网平台。原有的工业自动化设备、数据采集设备、实时控制设备、家电等使用的是搭载实时操作系统(RTOS)的微控制...

语言分词

通过自然语言处理组件的分词API,可以将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列。本页面主要介绍分词API对应的接口和返回结果中的关键字段的含义。说明:您可以登录至控制台,进行本API的调试。请求说明请求方法POST...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
产品推荐
智能语音交互 自然语言处理 云服务器 商标 生活物联网平台(飞燕平台) 轻量应用服务器 SSL证书 块存储 对象存储
这些文档可能帮助您
情感分析(通用) JAVA SDK 什么是智能对话机器人 Java SDK Python SDK SSML标记语言介绍

新品推荐

你可能感兴趣

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折