文章 2023-05-15 来自:开发者社区

单GPU每秒76帧,重叠对象也能完美分割,多模态Transformer用于视频分割效果惊艳

视频分割效果优于所有现有方法,这篇入选CVPR 2022的论文是用Transformer解决CV任务的又一典范。基于注意力的深度神经网络(DNN)在NLP和CV等不同领域的各种任务上都表现出了卓越的性能。这些进展使得此类网络(如 Transformer)成为解决多模态问题的有力候选。特别是近一两年,Transformer 模型已经开始在CV任务上大展手脚,从目标识别到检测,效果优于通用的CNN视....

单GPU每秒76帧,重叠对象也能完美分割,多模态Transformer用于视频分割效果惊艳
文章 2023-01-09 来自:开发者社区

CPU软编码视频,比GPU更好?

视频压缩,也称为视频编码,一般有CPU和GPU两种方式。也就是软编,硬编。从速度上来说,硬编的速度方面当然快多了。这是不是说软编没有优点了?看到一个说法:CPU软压在控制码率和画质的平衡上比NVENC好太多。据说GTX2000系的显卡的NVENC性能更好,能做到CPU压制的x264 faster压制出来画质的水平。吾记得NVIDIA的解码是半硬的,不知道编码是不是纯硬。

文章 2022-08-07 来自:开发者社区

论文学习:移动 GPU 上单目视频的实时面部表面形态

概述   我们提出了一个基于端到端神经网络的模型,用于从 AR 应用程序的单个摄像头输入推断人脸的近似 3D 网格表示。468 个顶点的相对密集的网格模型非常适合基于面部的 AR 效果。 所提出的模型展示了移动 GPU 上的超实时推理速度(100–1000+ FPS,取决于设备和模型变体)以及与同一图像的手动注释差异相当的高预测质量。一.介绍   通过对齐面部网格模板来预测面部几何形状的问题,也....

论文学习:移动 GPU 上单目视频的实时面部表面形态
文章 2021-11-28 来自:开发者社区

清华大学朱军详解珠算:贝叶斯深度学习的GPU库(附视频)

大会第一天下午,清华大学智能技术与系统国家重点实验室朱军发表了主题为《珠算:贝叶斯深度学习的 GPU 库》的演讲,他探讨分享了贝叶斯深度学习模型的计算平台:珠算。该平台由清华大学机器学习组开发,目前已经在 GitHub 上开源,参阅机器之心之前的报道《清华大学发布珠算:一个用于生成模型的 Python 库》。珠算项目地址:https://github.com/thu-ml/zhusuan在 GM....

清华大学朱军详解珠算:贝叶斯深度学习的GPU库(附视频)
文章 2018-11-08 来自:开发者社区

LiveVideoStack线上交流分享 ( 一 ) —— 解密GPU:视频转码与分析加速

为了给大家提供一个学习,交流的平台,畅聊音视频技术开发新趋势,新实践。我们推出了LiveVideoStack线上交流分享活动,在每周四晚19:30,邀请1名业内资深技术专家进行线上分享技术干货,解答热点问题。你可以通过以下方式参与: 关注LiveVideoStack公众号【livevideostack】 回复“分享”,即可获得进入直播群的方式 今晚 7:30,我们将邀请英伟达 高级工...

问答 2018-06-30 来自:开发者社区

DeepStream: GPU加速海量视频数据智能处理

"作为年度科技盛会,以“飞天•进化 Apsara Evolution”为主题的2016年云栖大会在杭州云栖小镇隆重召开。全球数万多名IT从业人员奔赴现场,共同描绘云计算发展趋势和蓝图,展现云计算、大数据、人工智能蓬勃发展的生态全景。 在云栖大会期间,NVIDIA资深技术经理赖俊杰分享了机器学习在银行企业的应用,NVIDIA DeepStream SDK等方面的内容。" https://yq.a.....

文章 2017-08-02 来自:开发者社区

谷歌公布 Video Intelligence API 助力视频内容搜索;Facebook 开源新一代机器学习 GPU 服务器 Big Basin | AI 开发者头条

▲内容预览: ● 谷歌收购大数据竞赛平台 Kaggle ● 谷歌公布新机器学习 API:从视频中识别物体 ● Facebook 开源新一代机器学习 GPU 服务器 Big Basin ● IBM InterConnect 2017 开幕在即,官方总结 Java 开发者的 6 大看点 ● GameCredits 向游戏开发者推出新版 API,强化数据...

谷歌公布 Video Intelligence API 助力视频内容搜索;Facebook 开源新一代机器学习 GPU 服务器 Big Basin | AI 开发者头条
文章 2017-07-03 来自:开发者社区

大数据时代GPU是视频结构化核心处理模块

GPU是一种专门在个人电脑、工作站、游戏机和一些移动设备上图像运算工作的微处理器。在安防大数据及深度学习的大背景下,具有研发实力的厂商纷纷基于GPU进行视频相关产品(前端智能及后端服务器等)研发,之前被称为视频核弹的Jetson TX1 GPU模块,已经广泛应用于人工智能市场(包括无人机、机器人等设备)及安防监控市场(智能摄像机、人脸识别摄像机等),安防厂商海康、宇视、文安及格灵等公司,均已展示....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注