文章 2025-09-17 来自:开发者社区

函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代

在云计算的发展过程中,计费方式往往是开发者最直观的感知。最初,用户需要直接购买资源,按小时计费;后来,函数计算将粒度细化到按请求执行的毫秒级。很多开发者第一次接触一款云产品时,关注的往往不是架构,而是账单。因为账单背后映射的,正是云厂商在 资源抽象、调度方式、安全隔离与开发体验 上的关...

函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代
文章 2025-09-17 来自:开发者社区

函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代

作者:砥行 在云计算的发展过程中,计费方式往往是开发者最直观的感知。最初,用户需要直接购买资源,按小时计费;后来,函数计算将粒度细化到按请求执行的毫秒级。很多开发者第一次接触一款云产品时,关注的往往不是架构,而是账单。因为账单背后映射的,正是云厂商在资源抽象、调度方式、安全隔离与开发体验上的关键选择。 函数计算的演进史,其实也是一部计费方式的演化史。透过计费这...

函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代
文章 2025-09-16 来自:开发者社区

重塑云上 AI 应用“运行时”,函数计算进化之路

作者:世如 引言:AI 应用的“电器时代”与运行时的“隐形枷锁” 阿里云王坚博士曾不止一次的强调云计算的核心价值 —— 成为数字时代的“超级电网”;19 世纪末,电力的发现开启了人类历史的第二次工业革命。然而,真正引爆这场革命的,并非仅仅是爱迪生发明的灯泡,而是特斯拉等人构建的交流电系统和覆盖千家万户的 “电网”。 电网让创新者们不再需要为每...

重塑云上 AI 应用“运行时”,函数计算进化之路
文章 2025-07-28 来自:开发者社区

云上AI推理平台全掌握 (5):大模型异步推理服务

在大模型推理的实际应用中,“高计算量、长时延”的推理场景(如 AIGC、视频理解、长文档摘要等)往往需要数十秒甚至分钟级的计算时间。传统同步推理模式导致客户端长时间阻塞,不仅造成连接资源浪费,更可能因网络抖动造成请求失败。行业数据表明,当推理耗时超过15秒时,同步请求的超时率会陡增至62%,严重制约了 AI 服务在高延迟场景下的可用性。 对于上述提到的推理耗时比较长或者推理时间...

云上AI推理平台全掌握 (5):大模型异步推理服务
文章 2025-07-18 来自:开发者社区

云上AI推理平台全掌握 (4):大模型分发加速

当大模型推理服务遭遇突发流量,扩容往往慢在“最后一分钟”:新实例扩缩容过程中,仍需从存储系统上拉取数十乃至上百 GB 的模型或数据,网络 IO 成为瓶颈。当突发流量来临时,这种延迟会导致自动扩缩容机制失效,算力在等待模型加载的过程中持续闲置,而客户请求已在接入层大量堆积。另外在多模态 AIGC 生成的场景中,推理请求会涉及到频繁切换基础模型和 lora 模型,每次切换都需从存储系统回源读取模型,....

云上AI推理平台全掌握 (4):大模型分发加速
文章 2025-07-14 来自:开发者社区

云上AI推理平台全掌握 (3):服务接入与全球调度

在 AI 推理服务全球化部署的今天,企业正面临跨地域流量调度、异构网络接入、高安全要求与低延迟保障的多重挑战。据行业调研,超过60%的 AI 推理性能问题源于非最优的网络路径选择,而混合云场景下的服务接入复杂度更是导致运维成本飙升300%。阿里云人工智能平台 PAI 平台推出的全球化的服务接入矩阵,正重新定义 AI 服务的高可用接入标准——从单地域 VPC 安全隔离到跨洲际毫秒级调度,让客户的推....

云上AI推理平台全掌握 (3):服务接入与全球调度
文章 2025-07-11 来自:开发者社区

云上玩转Qwen3系列之四:构建AI Search RAG全栈应用

本文详细介绍了如何使用人工智能平台 PAI 大模型应用开发 PAI-LangStudio 和 Qwen3,构建基于 AI 搜索开放平台 x Elasticsearch 的 AI Search RAG 智能检索应用。通过使用 AI 搜索开放平台、Elasticsearch 全文检索+向量检索引擎的混合检索技术配合最新发布的 Qwen3 推理模型,编排在一个 Agentic Workflow 中,为....

云上玩转Qwen3系列之四:构建AI Search RAG全栈应用
文章 2025-06-27 来自:开发者社区

云上AI推理平台全掌握 (1):PAI-EAS LLM服务一键压测

在云上构建高效、可扩展的 AI 推理平台,不仅需要应对千亿参数模型的计算复杂度,更需解决高并发、低延迟、动态负载等现实挑战。只有通过科学、贴近业务的压测体系,才能验证平台在真实场景下的极限承载能力。 本期内容将聚焦云上 LLM 推理服务的压测实践,帮助企业和开发者在复杂业务流量下,实现推理性能的精准调优与成本优化,为大规模 AI 应用落地筑牢基础。 阿里云人工智能平台 ...

云上AI推理平台全掌握 (1):PAI-EAS LLM服务一键压测
阿里云文档 2025-03-31

如何使用AI助理?

“CADT AI 助理”是帮助用户通过自然语言交流快速设计和生成云应用架构的工具。使用AI助理可以对话生成阿里云云业务架构图,并支持修改。AI助理可以降低用户云上业务架构设计的复杂度。

文章 2025-01-17 来自:开发者社区

MiniMax云上AI数据湖最佳实践

MiniMax云上AI数据湖最佳实践   内容介绍: 一、关于MiniMax 二、MiniMax云上基础架构情况 三、MiniMax基于阿里云的AI数据湖实践 四、与阿里云存储持续共创AI数据湖边缘缓存方案   本节课的主题是MiniMax云上AI数据湖最佳实践,由主讲人阿里云弹性计算机技术专家高庆端分享。 ...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"activityCardStyle","productCardInfo":{"productTitle":"","productDescription":"","productContentLink":"","isDisplayProductIcon":true,"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"AI 编码","activityDescription":"百万 Qwen-coder 大模型 tokens 免费体验,灵码79元起,加速 AI 应用落地 ","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock","activityButton1":{"activityButtonText":"查看详情","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding"},"activityButton2":{"activityButtonText":"立即体验","activityButtonLink":"https://bailian.console.aliyun.com/?spm=5176.30202035.J_VanPN1KXIVRyCVhZMwQ6t.6.1b791e71pokqL0&tab=model#/efm/model_experience_center/text?currentTab=textChat&modelId=qwen3-coder-plus"},"activityButton3":{"activityButtonText":"立即购买","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding#J_1"}}}
AI 编码
百万 Qwen-coder 大模型 tokens 免费体验,灵码79元起,加速 AI 应用落地

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注