阿里云文档 2025-10-23

在ACK中快速体验大语言模型推理服务

ACK托管集群Pro版提供了测试环境和生产环境部署方案,在无需管理底层硬件与依赖的前提下,快速验证大模型的推理能力。解决开发者在本地验证大语言模型时面临的GPU资源不足和环境配置复杂等问题。

问答 2024-08-07 来自:开发者社区

modelscope-funasr部署asr处理并发请求的框架有吗? 除了funasr

modelscope-funasr部署asr处理并发请求的框架有吗? 除了funasr

问答 2023-11-29 来自:开发者社区

在ModelScope中,部署了自己的openai_api,处理了并发问题呢?

部署了自己的openai_api,处理了并发问题呢?三个用户请求,并行处理,目前看到都是串行等待处理。(使用的fastapi,开启动多个worker,就加载多次大模型,导致显存不够,解决不了多进程共享大模型model变量)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐