产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
音视频终端 SDK
音视频终端 SDK(MediaBox SDKs)集成了直播推流、视频播放、短视频创作、美颜特效、音频特效等核心能力,为用户提供一体化 SDK,支持移动端、PC 端、Web 端等多终端接入,搭配开源 UI 组件和产品级 Demo,支持用户根据业务需求集成所需 SDK 以及采用低代码方式快速搭建所需应用。
音视频终端智能方案,多种玩法限时免费试用
产品 Demo
免费试用
产品文档
MediaBox音视频SDK|WEB体验馆
端侧智能免费试用
产品优势
产品功能
应用场景
更多产品与服务
文档与工具
产品优势
节省体积
融合直播和点播核心能力,复用核心组件,缩小 SDK 包体积
高效集成
一次性批量接入多个功能模块,提升集成效率,节省研发对接成本
接入灵活
按照业务需要自由组合功能模块,按需打包贴合业务场景
简单易用
产品级 Demo 提供直播、点播全功能能力,贴合业务实践需要,便于快速整合
服务多样
完善的指标体系确保服务质量,音视频 AI 提升音视频利用和分发效率
功能稳定
经过数亿级请求量的打磨,音视频服务质量稳定可靠,为用户提供流畅清晰的体验
产品功能
亮点功能
播放器 SDK
推流 SDK
短视频 SDK
美颜特效 SDK
音频特效 SDK
质量服务
音视频终端 SDK 提供多维度的 QoS 和 QoE 指标分析能力,可通过全面的数据服务体系,实现成本和体验之间的平衡
全平台 H.265
(1)成本优化,使用全平台 H.265 方案可在相同清晰度下使 CDN 带宽消耗量下降 30~50%,且 Web端 H.265 覆盖度达 95% 以上(2)改善体验:起播耗时下降 13%、弱网环境下百秒卡顿时长下降 25%,提升用户观看体验和留存转化率
端侧超分
通过智能算法,保证画质的前提下节省带宽,提升播放清晰度和观众主观视觉体验,且覆盖主流设备节约硬件开销
局域网投屏
可以轻松实现局域网嗅探、投屏推送、投屏播控等功能,将内容传输到更大的屏幕,适用多种场景如直播、短视频、教育、办公等
高级 ABR 算法
针对多码率自适应打包的视频流,通过高级 ABR 可有效避免卡顿改善播放体验,相对普通 ABR 算法,高级 ABR 的卡顿率下降 80%、平均码率提升 4%,提升用户观看体验
阿里云播放器 SDK 是阿里云自研的全端音视频播放工具,播放器 SDK 具有集成便捷、全端覆盖、播放性能优秀等特点。同时提供丰富多样的播放玩法,多样化的视频安全方案支持和完善的播放数据服务,为客户提供云端协同的优质播放体验
稳定流畅的播放体验
播放器 SDK 质量稳定可靠,轻松支撑过亿每日播放vv(video view)、秒开率大于 85%、百秒卡顿时长小于 100ms。综合播放策略、设备适配软硬解方案确保播放流畅性
全平台覆盖一次性集成
播放器 SDK 支持 Web、Android、iOS、Flutter、Windows、macOS 和 Linux 等平台,有效支撑多屏播放的业务场景,满足客户多样需求。播放器 SDK 在不同平台下提供统一的接口设计,显性降低开发者跨平台集成的工作量
丰富多样的播放玩法
播放器 SDK 提供 DASH 伪直播、防遮弹幕、ASS 字幕、端侧画质增强等多种功能,为客户提供多场景的解决方案,满足客户的业务需求
复合视频安全方案支持
视频点播提供标准加密、阿里云视频加密(私有加密)和 DRM 加密方案,播放器 SDK 支持上述方案的加密解码,有效解决恶意下载扩散等侵权问题
完善的数据服务体系
通过播放器 SDK 埋点,我们提供全盘宏观统计、实时质量监控。针对播放异常,我们提供用户级和播放会话(video view)级的全链路追溯能力,快速定位异常原因,避免负体验影响扩散
直播点播一体服务
播放器 SDK 同时支持常见的视频直播、视频点播功能,一次集成多场景使用
阿里云推流 SDK 是基于阿里云强大内容分发网络和音视频实时通讯技术的客户端推流开发工具,支持 Android、iOS、Flutter 多端多平台推流,为用户提供简单易用的开放接口、网络自适应的流畅体验、多节点的低延迟优化、功能强大的实时美颜等服务
直播推流
支持 RTMP 协议直播推流,并支持 RTMP、FLV、HLS、ARTC 直播拉流协议,分辨率支持 180P~720P;支持横屏、镜像、纯音频、静音、后台等多种推流方式
超低延时直播
提供基于 UDP 协议的 WebRTC 推流,且控制台支持自助开通 WebRTC 推流域名,优秀的弱网抗性,带给用户毫秒级超低延迟直播体验
直播连麦
提供基于实时音视频 RTC 的直播连麦解决方案,帮助客户实现超低延时、更多人数的直播实时互动
动态适应
动态码率支持根据网络情况自动调整推流码率,支持多种模式设置,使直播更加流畅;动态分辨率支持根据网络情况自动调整推流分辨率
实时美颜
支持人脸识别高级美颜,包含磨皮、美白、瘦脸、小脸、大眼等功能
音频处理
支持背景音乐播放,音乐和人声混音,耳返,噪音降噪等音频处理
阿里云短视频 SDK 是集短视频录制、裁剪、编辑、上传等功能于一体的开发者工具。短视频 SDK 提供易用、稳定、统一的接口和开源产品级的 UI 界面,用户可以根据自己的业务搭建短视频相关功能,还可以基于开源的 UI 界面完成界面定制,实现个性化的二次开发
自定义 UI
提供完整的 UI 交互源码,用户可自定义 UI 界面或者默认 UI 界面
视频录制
支持多端录制、变速、清晰度、屏比等多种拍摄设置;支持实时水印、实时滤镜、实时特效、实时美颜、合拍等多种录制方式;同时支持多路混音、回声消除、音频降噪等
视频编辑
支持照片视频剪裁、视频截图、按帧预览、多路拼接、多路混排、画中画、背景音乐、本地配音等功能
特效编辑
支持时间特效、画面调节、特效滤镜、转场涂鸦、音频变声等功能
动图字幕
支持动图、普通字幕、气泡字幕、花字、翻转字幕等
视频模版
支持在编辑界面添加 MV 效果,切换 MV,可引导客户选择相应的视频或图片,根据设计好的 AE 模板结构进行视频的合成,批量剪辑同款视频
阿里云美颜特效 SDK 是基于自研的智能视觉算法、海量规模的人脸人体检测和识别技术提供的美颜特效功能。支持画面美化、人像美颜、抠像制作、贴纸美妆、动作识别、美体、美发、AR 隔空写字等各种个性化定制服务
人脸美颜
整体智能美颜包括 5 档,手动美颜支持美白、磨皮、锐化、美肤、眼袋、祛法令纹、白牙 7 项功能,每项功能参数可调
人脸美型
整体智能美型包括 5 款风格可选,手动美型包括瘦脸、脸长(双向)、削脸、下巴(双向)、下巴长短(双向)、嘴型(双向)、嘴唇厚度(双向)、鼻翼(双向)、瘦鼻(双向)、瘦下颌骨、瘦颧骨、大眼、眼角(双向)、眼距(双向)、眼睛高度、人中(双向)等
人脸美妆
整体智能美妆包括活力妆、元气妆、优雅妆等 5 款,手动美妆支持高光、美瞳、口红、眼妆、腮红 5 款,各项强度可调节
实时风格滤镜
支持数十款滤镜效果,并持续更新素材库。实时渲染处理,让视频场景瞬间变美变好看,满足各类视频场景处理需求。实时渲染画面处理,效果自然贴合场景。持续扩展的滤镜素材库与效果调优
动态贴纸
基于人脸关键点技术和智能算法,贴纸精准贴合面部,并可根据面部表情动作变化实时跟随。贴纸支持静态、动态,并会持续扩容素材库,为视频场景提升生动性、趣味性、互动性
蓝/绿幕抠像
支持蓝色和绿色背景幕布抠像。精准识别人体,与背景精细分割,支持多光线、正侧面等复杂环境的抠像,并实时跟随
手势识别
基于自研的算法技术,支持手部 22 个关键点位的实时精准检测,可识别 25 款常用手势动作。支持左右手识别,最多可同时识别 8 只手
动作检测
基于自研的算法技术,支持人体 18 个关键点位的实时精准检测,可识别直立、举手、比心、叉腰、超人等 13 种静态姿势识别,同时还支持跳绳、开合跳、深蹲、俯卧撑、仰卧起坐等 9 种动态动作检测,并实时提供计数反馈
AR 隔空写字
通过手势识别算法识别出手指关键点的轨迹,同时通过判断用户的手处于落笔或抬笔的状态信息,把用户写的内容渲染在视频内,从而实现 AR 隔空书写的效果。可广泛应用于直播、教学、在线互动等各种场景
背景保真
可以实现在一般场景下对人物主体进行处理的同时,减少对背景的色调和纹理的影响。目前美白、红润、磨皮、锐化、智能美颜功能已默认开启背景保真功能,无需设置相关参数
音频特效 SDK 致力于泛娱乐影视体验、音视频实时通信、音乐理解与处理等场景音频技术的应用,通过音频技术为用户提供优质的音视频交互体验
环绕声
提供影视中音频内容的环绕声渲染技术。在两声道立体声的设备上,通过独有的声学算法对 5.1/7.1 等多声道及立体声影片进行耳机、外放的虚拟环绕渲染,使听众可以在耳机或外放上感受到从四面八方传来的声音,带来饱满的,有层次感和方向感的影院级听觉体验
全景声
提供全景声内容的生产-消费全链路技术。将全景声音频(Ambisonics 格式)通过独有的双耳渲染技术转换为含有全部空间信息的双声道音频,在 VR 头显以及具有陀螺仪的手机设备上实现自由视角下,声像始终保持统一,人转动,声源位置不动的沉浸式体验,可用于 VR 直播,VR 点播等场景
音量归一
提供先进的音量归一技术。在所有的音频内容中可提供流畅一致的音量水平,解决音量在不同音频内容上忽大忽小的恶劣体验
人声增强
提供高质量的人声增强技术。在不改变音色的前提下,将影视中的对白部分进行凸显,使嘈杂场面中的对白更加清晰明亮,使用户不再错过精彩内容
应用场景
音视频播放
直播推流与连麦互动
短视频创作
美颜特效
简介
提供高稳定、全平台、高性能的音视频解码能力,适用于视频直播、视频点播、音频收听等音视频消费场景。
产品 Demo
能够提供
短视频
使用播放器 SDK 搭配网络优化、预加载、本地缓存等功能,实现首屏秒开,提供流畅的播放体验
长视频
使用播放器 SDK 提供多码率自适应、变速不变调、端侧画质增强等功能,结合云端服务为长视频观影提供进度条缩略图、防遮弹幕、ASS 字幕等多样玩法,同时配合多重安全策略确保视频安全
在线教育
播放器 SDK 全端覆盖充分满足业务需求,现已支持移动端(Android、iOS)、桌面端(Windows、macOS、Linux)和跨端方案(Web、Flutter),同时支持多种加密方案实现有效的版权保护,包含标准加密、私有加密和 DRM 加密
直播与直播转点播
播放器 SDK 同时支持视频直播、音视频点播常见协议,无缝对接直播服务,支持直播时移、伪直播、直播录制视频回看,实现音视频业务闭环
简介
提升网络波动抵抗力和传输速度,提供稳定,极速的直播体验,适用于教育、娱乐、游戏、连麦等场景
产品 Demo
能够提供
教育直播
提供互动消息 SDK 实现文字实时互动,提升师生间的互动;提供推流 SDK 让教师随时随地为学生解惑答疑;同时,提供云端录制、转码等功能,学生可以随时回看课程,温习知识点,增强学习效果
娱乐直播
提供实时聊天、点赞和打赏等功能,增强主播与观众的互动;同时,对内容的安全性(如涉黄、暴恐等)进行严格把关,借助直播鉴黄功能降低审核成本
游戏直播
提供录屏技术将当前游戏画面和摄像头采集画面合并,通过推流 SDK 发起推流,推流 SDK 支持录屏功能;同时,提供互动消息 SDK 实现聊天、点赞和打赏等交互行为;提供直播录制回放,对游戏中的精彩内容进行回放
连麦互动
提供稳定、高质量、超低延时的互动实时音视频服务。支持主播与主播、主播与观众实时连麦、主播跨房间互动等多画面实时视频互动,并可将互动视频流推送至直播中心进行大规模分发,推送给未连麦的观众
简介
快速上线短视频采集、制作和播放等必备功能,适用于娱乐、社交、教育、新闻资讯、电商等对短视频拍摄制作和多创意玩法有需求的场景。
产品 Demo
能够提供
新闻资讯短视频
提供移动端短视频录制,可实时拍摄新闻内容,分享最新资讯,集编辑、上传、转码、存储、资源管理和云端编辑于一体,实现新闻的快速制作和发布
社交娱乐短视频
通过移动端快速拍摄,搭配美颜滤镜、人脸贴图、动态贴纸、字幕音乐、剪辑拼接等功能,用户可制作专属视频,实现快速上传和实时分享
电商产品短视频
提供快速拍摄和短片制作能力,全面和立体的展示商品特色;配合动图、字幕、音乐等特效,同时结合物品识别、智能推荐、边看边买等技术,有效提升购买转化
简介
美颜特效 SDK 提供各类贴合业务场景的美化特效处理,适用于直播、长短视频、在线教育、视频会议等场景
产品 Demo
能够提供
直播场景
适用于各类直播场景,满足实时美颜美化需求
长短视频场景
辅助视频制作,提供各类贴合业务场景的美化特效处理
在线教育场景
帮助老师上课前的美颜美化,效果自然,提升亲和力,提供手部、人体关键点识别技术
视频会议场景
在线会议过程中的实时美颜美化和互动,人脸、人体关键点定位识别精准,隔空写字,绿幕蓝幕抠像等,丰富远程沟通场景
更多产品与服务
视频直播
视频直播是基于阿里云内容接入与分发网络技术以及大规模分布式实时视频处理技术打造的直播服务平台,为用户提供易接入、低延迟、高并发和高清流畅的音视频直播服务。
查看详情
视频点播
视频点播是集音视频采集、编辑、上传、媒体资源管理、自动化转码处理(窄带高清™)、视频审核分析、分发加速于一体的一站式音视频点播服务。
查看详情
文档与工具
产品介绍
快速了解音视频终端 SDK
SDK License
SDK License 操作指南
SDK 下载
SDK 版本选择和集成
产品计费
了解计费组成