阿里云文档 2025-06-05

通义万相2.1通用图像编辑API参考

本文介绍通义万相-通用图像编辑模型的输入输出参数。

阿里云文档 2025-05-15

LivePortrait图像检测API

LivePortrait-detect模型,用于确认输入的人物肖像图片是否符合LivePortrait模型的输入规范。本文档介绍了该模型提供的图像检测能力的API调用方法。

阿里云文档 2025-04-30

图像API文档常见问题

图像API接口的通用问题汇总,包含接口调试、模型计费与限流、接口高频报错等。

文章 2025-04-17 来自:开发者社区

别让创意卡在工具链!MiniMax MCP Server:MiniMax 开源 MCP 服务打通多模态生成能力,视频语音图像一键全搞定

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 "别让创意卡在工具链!这个中间件让多模态生成像发微信一...

别让创意卡在工具链!MiniMax MCP Server:MiniMax 开源 MCP 服务打通多模态生成能力,视频语音图像一键全搞定
文章 2025-04-11 来自:开发者社区

还在手写SVG?OmniSVG:复旦团队开源多模态矢量生成神器,文本图像秒变可编辑SVG!

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 「设计师集体解放!复旦开源模型把矢量生成变成填空题」 ...

还在手写SVG?OmniSVG:复旦团队开源多模态矢量生成神器,文本图像秒变可编辑SVG!
文章 2025-03-20 来自:开发者社区

Gemma3:Google开源多模态神器,轻量高效,精通140+语言,解锁文本与图像任务

00.引言 在当今快速发展的 AI 领域,多模态模型正逐渐成为推动技术革新的重要力量。Google 最新推出的 Gemma 3 模型,凭借其轻量级、多模态的特性,为文本生成和图像理解任务带来了全新的可能性。它不仅支持文本和图像输入,还具备强大的语言处理能力,覆盖超过 140 种语言,并且能够在资源有限的设备上高效运行。从问答到摘要,从推理到图像分析,Gemma 3 正在重新定义 AI 模...

Gemma3:Google开源多模态神器,轻量高效,精通140+语言,解锁文本与图像任务
阿里云文档 2025-02-18

背景生成,图像背景生成

通义万相-图像背景生成模型专为商品换背景而设计。您可以选择文本引导(通过输入中英文描述生成背景)、图像引导(使用现有图片作为背景参考),或同时结合这两种方式。此外,模型还支持使用边缘引导元素(即图像的增强边缘特征),可以指定前景和背景内容。借助边缘引导元素,前景和背景在生成时能更自然地与商品融合。该模型适合电商和海报场景,助您快速生成高质量的商品图像。

文章 2024-12-12 来自:开发者社区

TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 多模态交互:支持语音、文本和图像的交互,提供自然的人机沟通方式。 实时通信:集成 RTC 技术,实现低延迟的语音和视频交互。 模块化设计:开发者可以轻松扩展功能,支持多语言和...

TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
文章 2024-12-01 来自:开发者社区

Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 生成模式:支持变体生成、图像到图像转换、智能修复、ControlNet 引导生成等多种模式。 多模态理解:结合 Qwen2VL 模型,实现图像和文本的深度融合,提供高级文本到图...

Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式
阿里云文档 2024-09-20

图像生成图像,涂鸦作画

根据手绘图加上任意文字描述,使用通义万相-涂鸦作画模型,即可轻松完成涂鸦作画。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

+关注