魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战
作者:谢宣松(星瞳),达摩院开放视觉智能资深算法专家 一、 视觉技术发展史 视觉是人类获取信息的最大渠道,它的应用非常广泛。在视觉领域,所有的信息都从感知增强开始,通过压缩传输、评估安全、搜索挖掘、生成编辑、认知理解,直至最后的重建互动。 视觉分类有很多维度,可以从技术、模态等维度进行分类。比如识别分割、缺陷检测、语义分割、外在识....
魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战(中)
二、 ModelScope社区视觉模型概览 除此之外,阿里巴巴通过“模型+服务”或者“模型+数据”的方式,完成了模型形态的能力开放。主要分为视觉感知类、视觉理解类、视觉生产类。ModelScope社区兼容国际主流的开源框架,坚持学术研究与产业应用的双轮驱动。 接下来,介绍一些在ModelScope社区开源的视觉模型。如上图所示,视觉理解,开放能力主要分....
魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战(下)
接下来,讲一讲多风格模型。用户输入的一张图可以有平面风格,立体风格,以及制作视频等等。除此之外,它还能将图片变成完整的3D卡通化视频。 接下来,讲一讲行业视觉的相关能力。由于高质量标注数据获取的成本极高,实际场景中存在大量已采集但未标记的领域数据。因此达摩院希望可以充分利用无标记数据,提升现有模型的精度。 达摩院将在ModelScope社区,持续开放视....
基于ModelScope,视觉AI启动模型开放之路
计算机视觉是人工智能的基石之一,也是应用最广泛的AI技术,从日常手机解锁使用的人脸识别,再到火热的产业前沿自动驾驶,视觉AI都大显身手。作为一名视觉AI从业者,我认为视觉AI的潜能远未得到充分发挥,穷尽我们这些研究者的力量,也只能覆盖少数行业和场景,远未能满足全社会的需求。因此...
阿里云视觉智能开放平台正式上线,阿里集团核心视觉AI能力对外开放
1月底,阿里云正式推出以计算机视觉AI能力为核心的视觉智能开放平台(vision.aliyun.com),平台目前已上线8大类目,超过50多种视觉AI能力,面向人脸识别,文字识别,商品理解,内容安全,图像识别,图像增强,目标检测等多个视觉应用核心场景。所有视觉AI能力都以API方式进行开放,最大程度降低开发者接入成本。 阿里云作为亚洲最大的公有云服务商,支撑起了国内最大的零售平台淘宝,天猫,最大....
阿里视觉AI开放之路:从公共云走向端云协同
正文:本篇内容将通过四个部分来介绍阿里视觉AI开放之路:从公共云走向端云协同。一、AI平台化之路二、阿里云视觉智能开放平台三、发布:云端协同框架OpenSDK四、进化与未来一、AI平台化之路AI开放平台一定要满足两个核心诉求。第一,提供标准化的AI能力和典型案例。第二,缩短需求和供给间的差距。构建AI供给和需求的有效路径。会遇到三个问题:第一,如何一站式、最大程度满足用户的主流AI需求?包括识别....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
AI更多视觉相关
产品推荐
阿里云机器学习平台PAI
阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。
+关注