阿里云文档 2025-10-23

在ACK中快速体验大语言模型推理服务

ACK托管集群Pro版提供了测试环境和生产环境部署方案,在无需管理底层硬件与依赖的前提下,快速验证大模型的推理能力。解决开发者在本地验证大语言模型时面临的GPU资源不足和环境配置复杂等问题。

问答 2024-07-01 来自:开发者社区

ModelScope模型自我认知微调后推理正常,部署也没报错,调用接口就报错,怎么解决?

Qwen-14B-Chat-Int8 ModelScope模型自我认知微调后推理正常,部署也没报错,调用接口就报错,怎么解决?

问答 2024-06-09 来自:开发者社区

ModelScope swift 微调mincmp模型后,推理和服务部署 有参考文档吗?

ModelScope swift 微调mincmp模型后,推理和服务部署 有参考文档吗?

问答 2024-04-16 来自:开发者社区

请问modelscope微调好的模型 怎么 用vllm 部署?

https://github.com/QwenLM/Qwen1.5/blob/main/docs/source/deployment/vllm.rst 请问modelscope微调好的模型 怎么 用vllm 部署?

问答 2024-04-16 来自:开发者社区

modelscope微调后模型量化的时候, swift是源码部署的报错怎么处理?

"modelscope微调后模型量化的时候,用qwen1half-14b-chat-awq 微调的 swift是源码部署的报错怎么处理?,用这个:CUDA_VISIBLE_DEVICES=0 swift export \ --ckpt_dir 'output/qwen1half-4b-chat/vx-xxx/checkpoint-xxx' \ --merge_lora true...

问答 2024-02-19 来自:开发者社区

ModelScope可以问swift微调吗,我在微调qwenvl后,求教有啥部署的框架吗?

ModelScope可以问swift微调吗,我在微调qwenvl后,求教有啥部署的框架吗?vllm貌似不支持lora部署vl

问答 2024-01-24 来自:开发者社区

modelscope-funasr不支持对微调模型转换成onnx格式,并部署至docker服务吗?

modelscope-funasr现在不支持对微调模型转换成onnx格式,并部署至docker服务吗?

问答 2023-12-27 来自:开发者社区

ModelScope用swift 微调完后能部署成一个 类openai 接口吗?

ModelScope用swift 微调完后能部署成一个 类openai 接口吗?

问答 2023-11-15 来自:开发者社区

ModelScope微调的模型,怎么在pai-eas上部署,有示例没有?

ModelScope微调的模型,怎么在pai-eas上部署,有示例没有?

问答 2023-11-01 来自:开发者社区

ModelScope中 sft微调后,再部署,发现这个问题,这个怎么解呢?

ModelScope中 sft微调后,再部署,发现这个问题,缺少 generation_config.json, 这个怎么解呢?用 qwen finetune qlora 微调

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐