文章 2025-10-25 来自:开发者社区

大模型分布式推理:张量并行与流水线并行技术

引言:大模型分布式推理的必然性1.1 模型规模与硬件限制的冲突当前大语言模型的参数规模已远超单个GPU的内存容量: 模型 参数量 FP16内存需求 单个GPU限制LLaMA-7B 70亿 14GB 24GB-80GBLLaMA-13B 130亿 26GB 40GB-80GBLLaMA-70B 700亿 ...

阿里云文档 2023-09-27

Spring Cloud Gateway应用路由使用EDAS Java Agent技术进行增强

EDAS使用Java Agent技术以无侵入的方式增强托管的Spring Cloud Gateway应用,支持动态路由和插件配置能力。本文介绍如何在EDAS中进行Spring Cloud Gateway的常见两类配置:路由(Route)和插件(GatewayFilter)。

阿里云文档 2023-09-13

数据库行业的发展及PolarDB-X的技术发展历程_云原生数据库PolarDB分布式版_云原生数据库 PolarDB(PolarDB)

本文介绍了数据库行业的发展及PolarDB-X的技术发展历程。

阿里云文档 2023-07-26

产品白皮书SOFAStack关键技术竞争力是什么

传统应用现代化:不止于异构应用治理在传统单体式架构向微服务架构迁移的过程中,随着应用微服务数量的增加,微服务间的通信、监控以及安全性管理成为新的挑战。服务网格作为应用与基础设施的桥梁,突破传统的 SDK 接入方式,以对应用透明的方式处理服务之间、服务与基础设施间的通信,实现应用研发和基础设施最大程度...

阿里云文档 2023-06-19

什么是开放技术赋能培训

本次培训主要介绍 Mesh 协议插件和功能插件。协议插件包含各种场景的私有协议接入;功能插件包括协议转换、拦截器以及动态配置等场景,帮助您高效、低成本、快速完成系统集成能力。

问答 2022-02-15 来自:开发者社区

图计算专场 大规模分布式图计算、学习和推理技术 及创新应用论坛

阿里云技术专家在2017杭州云栖大会中做了题为《图计算专场 大规模分布式图计算、学习和推理技术 及创新应用论坛》的分享,就阿里的“数据关联”,产品的解决方案和模型算法、系统支撑做了深入的分析。 https://yq.aliyun.com/download/1719?spm=a2c4e.11154804.0.0.70336a79nwokFv

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云分布式应用服务

企业级分布式应用服务 EDAS(Enterprise Distributed Application Service)是应用全生命周期管理和监控的一站式PaaS平台,支持部署于 Kubernetes/ECS,无侵入支持Java/Go/Python/PHP/.NetCore 等多语言应用的发布运行和服务治理 ,Java支持Spring Cloud、Apache Dubbo近五年所有版本,多语言应用一键开启Service Mesh。

+关注