文章 2023-05-23 来自:开发者社区

魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战

 作者:谢宣松(星瞳),达摩院开放视觉智能资深算法专家 一、 视觉技术发展史   视觉是人类获取信息的最大渠道,它的应用非常广泛。在视觉领域,所有的信息都从感知增强开始,通过压缩传输、评估安全、搜索挖掘、生成编辑、认知理解,直至最后的重建互动。   视觉分类有很多维度,可...

魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战
文章 2023-05-23 来自:开发者社区

魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战(中)

二、 ModelScope社区视觉模型概览  除此之外,阿里巴巴通过“模型+服务”或者“模型+数据”的方式,完成了模型形态的能力开放。主要分为视觉感知类、视觉理解类、视觉生产类。ModelScope社区兼容国际主流的开源框架,坚持学术研究与产业应用的双轮驱动。   接下来,介绍一些在ModelScope社区开源的视觉模型。如...

魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战(中)
文章 2023-05-23 来自:开发者社区

魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战(下)

接下来,讲一讲多风格模型。用户输入的一张图可以有平面风格,立体风格,以及制作视频等等。除此之外,它还能将图片变成完整的3D卡通化视频。  接下来,讲一讲行业视觉的相关能力。由于高质量标注数据获取的成本极高,实际场景中存在大量已采集但未标记的领域数据。因此达摩院希望可以充分利用无标记数据,提升现有模型...

魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战(下)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。