融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
在深度学习的背景下,NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格,2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群,实现对所有可用GPU资源的充分调度,不受制于供应商限制。 本文将深入探讨如何混合AMD/NVIDIA GPU集群以支持PyTorch分....

本手册旨在提供产品战略和功能、集成架构和模式、运营模式、以及中国实践等四方面的指导和建议, 帮助客户在阿里云上构建面向中国市场的“Salesforce中国客户360”。
背景信息阿里云携手 Salesforce,已将 Customer 360 引入中国。阿里云上的 Salesforce 包含两个部分:Salesforce Connected Experiences Gateway(互联网关CXG),专为中国打造的本地化扩展组件Salesforce 的全球核心产品,包...
蚂蚁集团服务网格落地实践的核心部分
2019 年双十一是蚂蚁集团架构云化的关键时间节点,Service Mesh 是应用云化非常重要的一环。业务与基础设施层的解耦势在必行,Mesh 化为这层解耦带来了实际可落地的解决方案。本文主要介绍蚂蚁集团 Service Mesh 落地实践的核心部分。
阿里云熊鹰:基于融合、协同系统的边缘云原生架构演进和实践
云原生和边缘计算是近两年都非常火的技术话题了,在第十届云计算标准和应用大会上,阿里云高级技术专家熊鹰分享了《基于融合、协同系统的边缘云原生架构演进和实践》,希望通过介绍现在阿里云在边缘计算和边缘云原生这些技术领域的系统架构演进,让大家了解到业务在云原生和边缘计算结合场景下落地的一些思考。 关注阿里云Edge Plus公众号,回复“熊鹰”,获得演讲PPT材料 概述 近几年边缘计算发展非常迅...

OpenStack与Kubernetes融合架构下的优化实践
如果你想使用Kubernetes来构建你的应用程序环境,通过OpenStack来部署Kubernetes其架构是一种推荐的方式,本文将与大家分享Kubernetes在OpenStack上的编排方式与其优化方法。 以下介绍5种针对Kubernetes的调优方式,希望对大家有所帮助。 接下来让我们从架构分析开始,了解为什么需要这样的架构存在,解决什么样的问题。接着了解优化的目的,我们深入探讨几个优化....
业务与信息系统深度融合,改变业务运营和创新模式:阿里巴巴企业级互联网架构(Aliware)实践
摘要:本文的整理自2017云栖大会-南京峰会上阿里中间件高级架构师宁晓民的分享讲义,讲义主要介绍了 的业务发展历程,并分享了阿里巴巴互联网架构的实践经验,最后还结合实际案例对于企业级互联网架构Aliware的应用进行了分享。 在2017云栖大会-南京峰会上,阿里中间件高级架构师宁晓民做了题为《企业级互联网架构(Aliware)实践》的分享。阿里巴巴技术架构经过了从零起步、松耦合架构、服务化,...
OPPO 数仓与数据湖融合架构升级的实践与思考
当我们谈数据湖,谈的是什么?InfoQ:数据湖和数仓融合架构是当下大数据领域非常重要的议题之一,不仅各大云厂商先后提出了自己的技术方案,开源社区也有一些项目(包括 DeltaLake、Iceberg 和 Hudi)非常活跃。其实数据湖这个概念诞生至今有挺长时间了,在您看来,目前业内对数据湖的定义和重要性是否已经达成一致?云厂商的产品和开源项目之间有什么差异吗?鲍永成:回答这个问题之前,我们得明确....

什么是Operator,Operator有哪些实践
Service Mesh 是蚂蚁集团下一代技术架构的核心,也是蚂蚁集团内部双十一应用云化的重要一环,本文主要分享在蚂蚁集团当前的体量下,如何支撑应用从现有微服务体系大规模演进到 Service Mesh 架构,并平稳落地。
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
架构更多实践相关
金融级分布式架构
SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。
+关注