
CVPR 2022 | 视频Transformer自监督预训练新范式,复旦、微软云AI实现视频识别新SOTA
机器之心编辑部复旦大学、微软 Cloud+AI 的研究者将视频表征学习解耦为空间信息表征学习和时间动态信息表征学习,提出了首个视频 Transformer 的 BERT 预训练方法 BEVT。该研究已被 CVPR 2022 接收。在自然语言处理领域,采用掩码预测方式的 BERT 预训练助力 Tran...
[帮助文档] 如何通过HaaS100实现端云一体AI识别
通过“老板来了”案例,来给开发者演示如何实现一个端云一体AI的AI识别功能。
看过10万个视频 AI才能识别你的脑残操作
本期论文提出:想要通过建立视频数据库来提升算法性能,那么这个数据库需要包含大量行为事件(包括:移动、捡起、抬举、抬举、击刺、投掷、倾倒、接入等等),从而让AI能够区分,人们到底是在执行什么逆天操作。 此前这类数据集极少。但在最新发布的数据集中,有10万个贴有标签的视频可供学习。 如何通过视频数据库来...
【星路演】视连通:视频场景化AI实时识别引擎
北京视连通科技有限公司是一家以计算机视觉和深度学习为基础,提供视频智能分析引擎和视频场景互动SaaS的科技创新公司。 北京视连通致力于视频的深度数据挖掘,提供视频内物体(包括商品、人物、场景等)的智能识别和衍生的应用模式服务。从视频分析出来的物体与广告植入、电商、游戏和社交等相结合产生新的商业价...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。