阿里云文档 2025-10-31

通义千问实时音视频翻译API客户端事件-大模型服务平台百炼-阿里云

本文介绍 qwen3-livetranslate-flash-realtime API 的客户端事件。

阿里云文档 2025-10-30

Fun-ASR Java SDK提供同步和流式语音识别接口

本文介绍Fun-ASR实时语音识别Java SDK的参数和接口细节。

阿里云文档 2025-10-30

Fun-ASR-RealTime Python SDK

本文介绍Fun-ASR实时语音识别Python SDK的参数和接口细节。

阿里云文档 2025-10-30

通过WebSocket调用通义千问实现实时音视频翻译-大模型服务平台百炼-阿里云

qwen3-livetranslate-flash-realtime 是通义千问推出的一款视觉增强型实时翻译模型。它能够同时处理流式的音频与图像输入(例如来自视频流),利用视觉上下文信息提升翻译的准确性,并实时输出高质量的翻译文本与音频。

阿里云文档 2025-10-28

通义万相通用图像编辑wan2.5API参考

通义万相-通用图像编辑wan2.5模型支持输入文本、单图或多图实现基于主体一致性的图像编辑、多图融合创作、组图生成等能力。

文章 2025-05-26 来自:开发者社区

实战 | Qwen2.5-VL模型目标检测(Grounding)任务领域微调教程

  01.简介 在目标检测领域,众多神经网络模型早已凭借其卓越的性能,实现了精准的目标检测与目标分割效果。然而,随着多模态模型的崛起,其在图像分析方面展现出的非凡能力,为该领域带来了新的机遇。多模态模型不仅能够深入理解图像内容,还能将这种理解转化为文本形式输出,极大地拓展了其应用场景。   鉴于此,本文旨在打造一份详尽的教程,指导读者如何通过对...

实战 | Qwen2.5-VL模型目标检测(Grounding)任务领域微调教程
问答 2024-05-01 来自:开发者社区

ModelScope中Qwen-vl-chat-int4模型训练是否有相关的教程?

ModelScope中Qwen-vl-chat-int4模型训练是否有相关的教程?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

通义大模型更多模型相关

产品推荐

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

+关注