问答 2024-08-19 来自:开发者社区

阿里云EMR推出的Remote Shuffle Service(RSS)解决了什么问题,并带来了什么

阿里云EMR推出的Remote Shuffle Service(RSS)解决了什么问题,并带来了什么好处,在2022年初做了什么重要的举措?

文章 2022-02-14 来自:开发者社区

阿里云EMR Remote Shuffle Service在小米的实践,以及开源

问题回顾Shuffle是大数据计算中最为重要的算子。首先,覆盖率高,超过50%的作业都包含至少一个Shuffle[2]。其次,资源消耗大,阿里内部平台Shuffle的CPU占比超过20%,LinkedIn内部Shuffle Read导致的资源浪费高达15%[1],单Shuffle数据量超100T[2]。第三,不稳定,硬件资源的稳定性CPU>内存>磁盘≈网络,而Shuffle的资源消耗....

阿里云EMR Remote Shuffle Service在小米的实践,以及开源

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐