阿里云文档 2025-12-24

AI模型推理服务在Knative中最佳配置实践

Knative和AI结合提供了快速部署、高弹性和低成本的技术优势,适用于需要频繁调整计算资源的AI应用场景,例如模型推理等。您可以通过Knative Pod部署AI模型推理任务,配置自动扩缩容、灵活分配GPU资源等功能,提高AI推理服务能力和GPU资源利用率。

阿里云文档 2025-12-17

运行AI应用与使用AI工具操控云手机-无影云手机-阿里云

本文介绍与AI工具和应用相关的云手机实践。

阿里云文档 2025-06-06

文件编辑在后端场景的使用_通义灵码_智能编码助手

通义灵码文件编辑,具备多文件代码修改(Multi-file Edit)和工具使用(Tool-use)的能力,可以与开发者协同完成编码任务,如需求实现、问题解决、单元测试用例生成、批量代码修改等。本文聚焦于后端研发中的典型场景,提供包含代码生成、代码重构以及自动化测试编写等核心场景使用实践。同时,通过结合企业私域数据,可实现符合企业特定的个性化推荐与生成,显著提升研发效率与质量。

阿里云文档 2025-05-16

文件编辑在前端场景的使用_通义灵码_智能编码助手

通义灵码 文件编辑,具备多文件代码修改(Multi-file Edit)和工具使用(Tool-use)的能力,可以与开发者协同完成编码任务,如需求实现、问题解决、单元测试用例生成、批量代码修改等。本文聚焦于前端研发中的典型场景,例如文生代码、图生代码、前端自研组件的引入、前端自研组件的代码重构等核心场景使用实践。

文章 2023-11-06 来自:开发者社区

云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理(2)

04 性能对比此时,我们的 OSS 上已经有两份 bloom-7b1 checkpoint,一份是 bloom-7b 文件夹存储了 huggingface 原生的 checkpoint,另一份是 bloom-7b-ft-fp16 文件夹存储了转换后的 FasterTransformer 的 checkpoint。我们将使用这两份 checkpoint 进行性能对比,看一下来 FasterTran....

文章 2023-11-06 来自:开发者社区

云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理(1)

01 背景OpenAI 在 3 月 15 日发布了备受瞩目的 GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋般出现,为我们带来了协同办公、客服对话、语言翻译、内容生成等方面前所未有的畅快体验。然而,当我们享受着大语言模型带来的普惠 AI 能力时,它也给开发者们带来了前所未....

云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理(1)
文章 2023-09-13 来自:开发者社区

火热开营丨快来报名云原生 AI 工程化实践训练营-探索系列

如果您对于使用容器 Kubernetes 技术运行 AI 业务感兴趣;如果您好奇容器 Kubernetes 技术如何支撑 AIGC 大模型应用;如果您希望尝试基于容器 Kubernetes 平台搭建大语言模型和生成式模型,以备企业新业务形态之需;那么,您就是「云原生 AI 工程化实践训练营」的理想学员!本期训练营是「云原生 AI 工程化实践训练营」三部曲的第一部,将带您学习使用容器 K8s 技术....

火热开营丨快来报名云原生 AI 工程化实践训练营-探索系列
文章 2023-08-07 来自:开发者社区

云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理

作者:颜廷帅(瀚廷)01 背景OpenAI 在 3 月 15 日发布了备受瞩目的 GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋般出现,为我们带来了协同办公、客服对话、语言翻译、内容生成等方面前所未有的畅快体验。然而,当我们享受着大语言模型带来的普惠 AI 能力时,它也给....

云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"activityCardStyle","productCardInfo":{"productTitle":"","productDescription":"","productContentLink":"","isDisplayProductIcon":true,"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"AI 编码","activityDescription":"百万 Qwen-coder 大模型 tokens 免费体验,通义灵码79元起,加速 AI 应用落地 ","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock","activityButton1":{"activityButtonText":"查看详情","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding"},"activityButton2":{"activityButtonText":"立即体验","activityButtonLink":"https://bailian.console.aliyun.com/?spm=5176.30202035.J_VanPN1KXIVRyCVhZMwQ6t.6.1b791e71pokqL0&tab=model#/efm/model_experience_center/text?currentTab=textChat&modelId=qwen3-coder-plus"},"activityButton3":{"activityButtonText":"立即购买","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding#J_1"}}}
AI 编码
百万 Qwen-coder 大模型 tokens 免费体验,通义灵码79元起,加速 AI 应用落地

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注