阿里云文档 2025-10-23

在ACK中快速体验大语言模型推理服务

ACK托管集群Pro版提供了测试环境和生产环境部署方案,在无需管理底层硬件与依赖的前提下,快速验证大模型的推理能力。解决开发者在本地验证大语言模型时面临的GPU资源不足和环境配置复杂等问题。

问答 2024-07-17 来自:开发者社区

ModelScope中,对于部署llm,在需要使用多张gpu时,是不是推荐使用偶数张gpu?

ModelScope中,对于部署llm,在需要使用多张gpu时,是不是推荐使用偶数张gpu?

文章 2023-11-15 来自:开发者社区

ModelScope部署到trt-llm

是的,ModelScope支持将模型部署到TRT-LLM (TensorRT Large Language Model) 上。TensorRT是一种高性能的深度学习推理优化器和运行时,它可以优化经过训练的神经网络模型以更快的速度运行在多种平台上,包括嵌入式设备和数据中心。千问大模型是由阿里云开发的一种大规模预训练语言模型,其中包含了大量的训...

问答 2023-11-15 来自:开发者社区

想问下ModelScope,这个能部署到trt-llm吗?

想问下ModelScope,这个能部署到trt-llm吗? 我部署了7b的千问

问答 2023-08-06 来自:开发者社区

ModelScope有没PAI空间部署LLM API服务通过摩搭本地访问inference API?

ModelScope有没PAI空间部署LLM API服务通过摩搭本地访问inference API?

问答 2023-08-06 来自:开发者社区

ModelScope可以通过摩搭提供的Notebook部署LLM模型,然后通过API方式本地访问吗?

ModelScope可以通过摩搭提供的Notebook部署LLM模型,然后通过API方式本地访问吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐