文章 2025-01-29 来自:开发者社区

Qwen2.5-VL:阿里通义千问最新开源视觉语言模型,能够理解超过1小时的长视频

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 模型介绍:Qwen2.5-VL 是阿里通义千问团队开源的旗舰视觉语言模型,具有3B、7B和72B三种不同规模。 主要功能:支持视觉理解、长视频处理、结构化输...

Qwen2.5-VL:阿里通义千问最新开源视觉语言模型,能够理解超过1小时的长视频
文章 2025-01-28 来自:开发者社区

DiffuEraser:阿里通义实验室推出的视频修复模型,支持高清修复、时间一致性优化

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 功能:DiffuEraser 能够修复视频中的遮罩区域,生成丰富的细节并保持时间一致性。 技术:基于稳定扩散模型,结合 BrushNet 和 UNet 架构...

DiffuEraser:阿里通义实验室推出的视频修复模型,支持高清修复、时间一致性优化
文章 2025-01-21 来自:开发者社区

通义万相2.1视频/图像模型新升级!可在阿里云百炼直接体验

模型新特征 01复杂人物运动,稳定展现 02现实物理规律,逼真还原 03中英文视频特效,约丽呈现 (生成的视频直接带音效!) 通过自研的高效VAE和DiT架构 增强了时空上下文建模能力 支持无限长1080P视频的高效编解码 首次实现了中文文字视频生成功能 升级后的通义万相 荣登VBench榜单第一 ...

通义万相2.1视频/图像模型新升级!可在阿里云百炼直接体验
文章 2025-01-11 来自:开发者社区

通义万相2.1:VBench榜单荣登第一!阿里通义万相最新视频生成模型,支持生成1080P长视频

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 功能强大:支持1080P无限长视频生成,具备复杂动作展现、物理规律还原等功能。 技术先进:基于VAE和DiT架构,增强时空上下文建模能力,支持高效编解码。 ...

通义万相2.1:VBench榜单荣登第一!阿里通义万相最新视频生成模型,支持生成1080P长视频
文章 2024-09-19 来自:开发者社区

通义万相发布视频生成模型,更懂中国风、中国话

9月 19 日,在杭州云栖大会上,阿里云CTO周靖人宣布通义万相全面升级,并发布全新视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。即日起,所有用户可通过通义APP及通义万相官网免费体验。 据介绍,通义万相首批上线文生视频、图生视频功能,在文生视频功能...

通义万相发布视频生成模型,更懂中国风、中国话
问答 2024-07-25 来自:开发者社区

通义听悟大模型可以对视频画片进行逐帧切片嘛?

通义听悟大模型可以对视频画片进行逐帧切片嘛?

问答 2024-04-16 来自:开发者社区

modelscope通义千问 官方视频里的截图,图片中Qwen1.5 全流程最佳实践,有文章版吗?

"modelscope通义千问 官方视频里的一个截图,图片中Qwen1.5 全流程最佳实践,有文章版吗?"

问答 2024-04-10 来自:开发者社区

阿里云OpenAPI的通义万相目前开放的接口能支持哪些?有文字、图像转视频的服务吗?

阿里云OpenAPI的通义万相目前开放的接口能支持哪些?有文字、图像转视频的服务吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

通义大模型

通义千问大模型家族全面升级更大参数规模模型首次面世,全新通义千问2.0版本欢迎体验。https://tongyi.aliyun.com/

+关注